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译者序 


线性代数课程在大学数学中占有重要地位，线性代数的教学内容和方向一直是数学工作者 
十分关心的问题.传统的线性代数教学偏重自身的理论体系，强调线性代数的基本定义、定理 
及其证明，对线性代数的方法和应用重视不够，几乎不涉及数值计算.这种做法在我国大学数 
学教学中有一定的代表性.但互联网和计算机技术的迅速发展极大地改变了科学技术和社会生 
活的面貌.在这样的形势下，数学教学也需要与时俱进，现有的线性代数课程的教学体系、内 
容和方式同样需要进行深刻的改革.但是改革的方向在哪里，如何把握当前线性代数教学发展 
的潮流，国际上的先进经验值得我们学习和借鉴. 

David C . Lay 教授是美国著名数学教育家、美国国家“线性代数课程研究小组”的核心成 
员，也是数学课程现代化的一位主要倡导者.他所编著的本书是一本线性代数的优秀现代教材， 
很值得我们参考学习.该书的主要 B 的是帮助学生熟练掌握线性代数的基本概念及应用技巧， 
为后续课程的学4和 T . 作实践奠定基础，教材的选材基于不同专业对线性代数知识的需求共同 
点.本书结合应用数学软件，强调了计算机对科学和工程学中线性代数的发展和实践的影响. 
登录 David C . Lay 教授的网页，可以链接到琳琅满目的学习指导、数据库、应用实例等材料.无 
论是学生还是研究人员，阅读这本教材后，一定会被线性代数的理论和应用材料所吸引，并从 
中找到学习线性代数的乐趣，体会到线性代数教学改革的世界潮流和方向. 

在我国高等教育双语教学的大环境下，从2002年起，华南理工大学计算机学院就开始使用 
英文教材 《 Linear Algebra and Its Applications 》进行教学.但是由于课程学时和硬件条件的限制， 
未能将原书的技术特点、网络优势完全发挥出来，我们一直希望能让更多的学生一起分享这本 
教材.可喜的是，机械 T . 业出版社引进了该书的中文版权，使我国高等学校的师生有机会学习 
这本线性代数著作，这必将有力地推动我国线性代数教学的改革. 

亟此翻译了作完成之际，译者非常感谢华南理工大学数学科学学院领导的鼓励和支持，教 
务处支持了书稿的打印了作.使用英文教材教学的黄凤辉博士、吴洪武博士仔细阅读了中译本 
初稿并提出了宝贵意见.此外，原书作者 David C . Lay 教授获悉我们准备翻译工作，给予了我 
们极大的鼓励和支持，在此表示衷心的感谢.由于译者水平和时间的限制，该译本存在的不足 
之处，敬请各位同行批评指正. 


译者 
2005年1月 
华南理工大学数学科学学院 



关于作者 


David C . Lay 在奥罗拉大学 （ 伊利诺伊州）获得学士学位，在加利福尼亚大学 （ 洛杉矶） 
获得硕士和博士学位.自1966年以来 ， Lay —直从事数学研究和数学教育工作，大部分时间是 
在马里兰大学帕克学院工作.他还是阿姆斯特丹大学、阿姆斯特丹自由大学和德国凯泽斯劳滕 
大学的访问教授.在泛函分析和线性代数方面，他已经发表的论文超过30篇. 

作为美国 NSF 资助项目“线性代数课程研究小组”的核心成员，目前， Lay 是线性代数课 
程现代化的领导人.此外，他还是几本数学教材的合著者，包括与 Angus E . Taylor 合著的 
《 Introduction to Functional Analysis 》、 与 L . J . Goldstein 和 D . I . Schneider 合著的 《 Calculus and Its 
Applications 》 以及与 D . Carlson , C . R.Johnson 和 A . D.Porter 合著的 《 Linear Algebra Gems 一 Assets 
for Undergraduate Mathematics ). 

作为顶尖的教育家， Lay 教授获得过四所大学的杰出教学奖，包括1996年获得马里兰大学 
著名学者-教师称号 .1994 年，他获‘得美国数学联盟授予的著名大学数学教学奖.他被大学生选 
为 Alpha - Lambda - Delta 国家荣誉专家协会和国家金钥匙荣誉协会的成员.1989年，奥罗拉大学 
授予他杰出校友荣誉 . Lay 是美国数学会、加拿大数学会、国际线性代数协会、美国数学联盟、 
Sigma Xi 以及美国工业和应用数学学会成员.自从1992年以来，他成为多届数学科学基督联盟 
全国委员会成员. 
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学生和教师对本书前两个版本的反响十分令人满意.第3版中概念更加形象化，而且在网 
上为学生和教师提供了进一步的技术支持.像以前一样，本书给出最新的线性代数基本介绍和 
一 些有趣应用，使得已完成大学第二学期数学课程（如学完微积分）的学生容易接受. 

本书的主要目的是帮助学生掌握以后课程学习所需要的基本概念和基本技能，教材的选题 
是根据“线性代数课程研究小组”的建议，该建议基于认真分析学生的实际需要和许多不同专 
业使用线性代数知识的共同点而提出.希望这门课能够成为对大学生最有用和最有趣的数学课 
程之一. 

鲜明的特色 

提前 介绍重 要概念 

许多建立在 K " 上的线性代数基本概念，包含在本书每章开始的“介绍性实例”中，然后从 
不同的观点逐步深人讨论.接下来，用第1章给出的熟悉思想的自然扩展来泛化这些概念.我认 
为，本教材的主要特色是全书的难度一样. 

矩阵乘法的现代观点 

好的记号是关键，且教材反映科学家和工程师实际应用线性代数的方式.本书在定义和证 
明中处理的是矩阵的列，而不是矩阵的元素，核心课题是将矩阵向量乘积 Ax 作为关于 A 的列 
的一个线性组合.这种现代方法简化了许多论述，且将向量空间思想和线性系统的研究联系在 
―■起. 

线性变换 

用线性变换作为线索贯穿整本教材，这增强了本书的几何趣味.例如，在第1章，线性变 
换给出一个动态的和几何观点下的矩阵向量乘法. 

特征值和动力系统 

特征值的概念出现在第5章和第7章.由于这一内容分散在数周的教学中，学生会比平常 
更容易吸收和复习这些关键概念.特征值来源并应用于离散动力系统和连续动力系统，相关内 
容出现在 1.10 节、 4.8 节、 4.9 节和第5章的五节中.在授课时可以选择不讲授第4章，而是在 



VI 


讲完 2.8 节和 2.9 节的内容以后直接进人第 5 章的学习.这两节可选的学习内容给出 r 第4章中 
出现的向量空间的概念，为第5章的学习奠定了基础. 

正交性和最小二乘法 

与普通人门教材相比，本书对这些主题的讨论更全面.“线性代数课程研究小组”强调需 
要正交性和最小二乘问题的内容，这是由于正交性在计算机计算和线性代数的数值计算中起着 
重要作用，且实际工作中经常会出现不相容的线性方程组. 

教学的特色 

应用 


广泛选取的应用说明了线性代数的作用，可以用于在工程学、计算机科学、数学，物理学、 
生物学、经济学和统计学中解释基本原理和简化计算.一些应用出现在单独的章 节中； 其他的 
应用是作为例题和习题而引人的.此外，每一章的开头给出一个线性代数应用的简短介绍，由 
此引出数学理论的发展.然后，在该章结束的部分又回到开始提到的应用. 

重点强调几何特点 

由于许多学生更容易接受形象化的概念，所以对书中的每个主要概念都给出几何解释.本 
书包含有较多的几何图形，且一些图形是以前的线性代数教材中没有出现过的. 

例题 


与大多数线性代数教材相比，本书有更多的例题，比平常课堂上更多.由于例题清晰，步 
骤详细，因此学生可以自学. 

定理和证明 

重要的结果以定理的形式给出，其他有用的事实放在方框中，便于参考.大多数定理有正 
式证明，写法易于理解.在少数情形中，仔细选取的例题证明中展示了基本计算过程.一些常 
规的验证保留在习题中，这对学生是有益的. 

练习题 

在习题之前有几个仔细选取的练习题，其解答在习题之后给出.这些练习题或者集中于习 
题中的潜在难点，或者给出做习题前的“热身”，且解答常包含有用的提示. 

习题 


提供的大量习题包含平常的计算题和需要深人思考的概念题，一些习题针对多年来我在学 
生作业中发现的概念难点.每一个习题都按照课本中内容的顺序仔细 排列； 这样当每节的一部 
分内容讲授之后，就可以安排家庭 作业. 习题的一个显著特色是数值计算不复杂，问题很快被 
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“展开”，学生在数值计算上花费时间很少，习题主要是为了让学生理解教学内容而不是进行机 
械计算. 

判断题 

为鼓励学生阅读全部课本内容且深人思考，本书设计了 300个简单的判断题，出现在33 
节内容之中，并放在计算题之后.可以通过阅读课本内容来回答这些问题，从而使学生可以准 
备好回答随后的概念题.学生在习惯了仔细阅读课本内容之后，会喜欢这类题目.基于课堂测 
验以及与学生进行探讨，我决定不将答案放在课本中.补充的150道判断题（大部分在每章末 
尾 ） 用于检验学生对内容的理解程度.对大部分这类问题，教材中提供了简单的正确/错误回答， 
但是省略了答案的验证（通常需要进一步思考才可完成）. 

写作题 

写出严谨的数学论述，不仅对那些希望成为数学系研究生的学生，而且对所有学习线性代 
数的学生都十分必要.本书包含的证明大多是习题答案的一部分.需要简短证明的概念题，常 
包含可以帮助学生开始解题的提示.对所有奇数的写作题，或者在课本的后面给出一个解答或 
提示，或者在后面描述的“学习指导 ” （Study Guide ) 中给出一个解答. 

计算主题 

本书强调计算机对科学和工程中线性代数的发展和实践的影响，书中有许多“数值计算的 
注解”指出数值计算中出现的问题，以及理论概念 （ 如矩阵求逆）和计算机实现（如 LU 分解) 


网上支持 

学习指导 

网站 www . laylinalgebraxom 包含了学习本课程所需要的所有 内容： 教材的第1章，含有奇 
数习题的 答案； 习题的数据 文件； 复习资料和练习 试卷； “学习指导”的第1章. 

复习资料和练习试卷 

多份附有解答的试卷覆盖了教材的所有主要 内容. 它们直接来自于近年来我所教授的课程. 
每份复习资料给出了教材指定部分中重要的定义、定理和计算技巧. 

案例研究和应用项目 

七个案例研究扩展了每章开始所介绍的主题，增加了现实世界的数据，提供了进一步探索 
的 机会. 学生将会发现这些阅读材料很有趣.教师可以给学生安排其中所包含的项目 . 20多个 
应用项目或者扩展了教材中的主题，或者介绍了新的应用，例如立方体样条、交通流量、飞机 
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航线、运动比赛中的优势矩阵以及纠错码.一些新的数学应用是积分方法、多项式根的求解、 
圆锥曲线、二次曲面和二元函数的极值.线性代数的数值计算主题，如条件数、矩阵因式分解 
和求特征值的2穴方法也包含在内.在每个项目中都编有涉及大数据集的习题（因此需要使用 
计算机技术来求解）. 

数据文件 

对教材中的900道数值计算题、案例研究和应用项目，网站上提供了数百个相应的数据文 
件.这些数据以多种格式存储，分别用于 MATLAB 、 Maple 、 Mathematica 以及 TI -83+/86/89 和 
HP 48 G 图形计算器.对一道特定的题目，访问矩阵和向量只需要几次键击，从而减少了输人数 
据的错误，并可节省做作业的时间. 

补充内容 

学习指导 

平装本的“学习指导” （ ISBN 0-201-77013- X ) 作为完整课程的一部分，通过几种方式补充 
教材： 1 ) 它指导学生如何学习线性代数，包含学习和讨论各类定理和证明的逻辑结构的 建议； 
2) 它给出每第三个奇数习题的详细解答（包括大多数关键习题）和课本答案仅有“提示”的 
每一个奇数写作题的 答案； 3) 它为课本中使用的技术提供了 “实验手册”，为带有 [ M ] 的习题 
增加了提示，对 MATLAB 、 Maple 、 Mathematica 和图形计算器中初次使用的命令给出了适当 
描述. 

教师版 

为方便教师，这个特殊版本包含所有习题的简单答案，课本开始在“给教师的注释”中给 
出了有关课程内容设计和组织的解释，以帮助教师安排课程.该版本还提供了专为教师准备的 
其他支持材料. 

教师技术手册 

每一本手册给出了详细指导，集成了全书的特定软件包或图形计算器，由使用过该教材中 
的技术的教师编写而成. 

致谢 

我真诚地感谢多年来以各种方式帮助我的许多人. 

感谢 Israel Gohberg 和 Robert Ellis 长达15年的线性代数合作研究，他们帮助我形成了线性 
代数的观点. 
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与 David Carlson、Charles Johnson 和 Duane Porter 共同工作在“线性代数课程研究小组” 
是我的荣幸，在几个重要方面，他们关于线性代数教学的思想影响着本教材. 

对每章开始的例题和接下来的讨论，感谢以下人员的 帮助： 温思罗普大学的 Thomas Polaski 
教授； 纽约大学经济分析研究所的 Wassily Leontief 教授； 马里兰大学的 Clopper Almon ; 波音 
公司幻影工作室的 David P . Young ; 洪堡州立大学的 Roland Lamberson ； 地球卫星公司的 Russell 
Hardie 和 Chris Peterson . 

感谢提供技术支持的专家，是他们不辞劳苦地为第3版准备数据、给教师编写笔记、在“学 
习指导”中为学生编写技术笔记、将他们的项目和大家一起分享，他 们是： 泰勒大学的 Jeremy 
Case ( MATLAB )； 南卡罗来纳大学的 Douglas B . Meade ( Maple ); 惠氏学院的 Lyle Cochran 
(Mathematica )； 西方浸信会学院的 Michael Miller ( TI 计算 器）； 温思罗普大学的 Thomas Polaski 
( HP -48 G ). 同时还要感谢近几年我最好的两个本科生 —— Barker French 和 Ariel Weinberger , 
他们更新了第2版的 MATLAB 数据，检验了习题解答中的全部计算，并写了一些附加解答的 
草稿. 最后，感谢圣何塞州立大学的〗31^037和德雷克大学的1^06八加，他们允许我继续使 
用他们十年来为这本教材开发的杰出项目.他们的支持、鼓励和友谊对我是十分重要的. 

我真诚感谢下面审稿者的仔细分析和有创意的建议. 
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给学生的注释 


这门课程是最有趣、最有价值的大学数学课程.事实上，一些学生在毕业以后告诉我他们 
在大公司的工作中或工程研究生院的学习中还使用本教材作为参考书.下面的注释给出一些建 
议和信息，有助于你掌握课本内容并且从中得到乐趣. 

在线性代数中，概念和计算同样重要.每个习题集开始的简单数值练习仅仅帮助你检査对 
基本步骤的理解.以后，虽然计算机会进行数值计算，但你必须选取计算方法，知道如何解释 
结果，并且向其他人解释结果.由于这个原因，课本中的许多习题要求你解释或验证计算.书 
面解释经常是习题答案的一部分，对奇数习题，会有一个期望的解释或者好的提示.在独立写 
出答案之前应尽量避免査阅这些答案，否则，你会认为你已理解实际上并不懂的问题. 

为掌握线性代数的概念，你必须仔细地反复阅读本书.新的术语用黑体标示，有时写在定 
义框中.书的最后给出一个术语表，便于参考.重要的命题以定理的形式给出或放在方框中.最 
好阅读一下前言中对本书结构的介绍，以对课程的框架有初步的理解. 

实际上，线性代数是一种语言，必须用学习外语的方法每天学习这种语言.理解每一节的 
内容并不容易，除非你已透彻地学习教材且全部做出该节前面的练习，跟上课程的进度会帮助 
你节约很多时间和解决很多困惑！ 

数值计算的注解 

希望你阅读课本中的“数值计算的注解”，即使你现在没有在学习过程中使用计算机或图形 
计算器.在实际生活中，线性代数的大多数应用涉及一定数值误差限制下的数值计算，即使误 
差相当小.“数值计算的注解”会指出你以后工作中使用线性代数的潜在困难，如果现在学习了 
这些注释，你以后就会容易记起这些内容. 

如果你对“数值计算的注解”有兴趣，以后可以学习一门线性代数的数值计算课程.由于 
对计算机处理能力的更髙需求，需要计算机科学家和数学家给出更快、更可靠的线性代数的数 
值算法，需要电子工程师设计出更快和更小的计算机去运行这些算法.这是一个令人激动的领 
域，线性代数的第一堂课有助于你做好准备. 

学习指导 

为帮助你成功学习这门课程，我写了一本配合本书的“学习指 导”. 它不仅有助于你学习 
线性代数，而且说明了如何学习数学.它包含每第三个奇数习题的详细解答，以及课本答案仅 
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有提示的奇数写作题的附加答案.“学习指导”还给出常见错误的警告、重点习题的有用提示和 
潜在考试题，且有一个单独的各章术语表（考试复习时很有用）.此外，“学习指导”还介绍了 
如何使用 MATLAB 、 Maple 、 Mathematica 和 TI 、 HP 图形计算器，使用这些技术可以节约完成 
作业的时间. 

需要注意的是，之所以将“学习指导”与教材分开，是因为你必须在没有太多的帮助下独 
立完成作业.多年的经验使我知道太容易査到（如教材后面的）解答会妨碍学生数学能力的开 
发.前几周的学习会培养出整个学期的学习习惯，并影响到学习效果.我将“学习指导”的第1 
章放在网上，你可以在获得“学习指导 "（ ISBN 0-201-77013- X ) 之前就开始学习.请先阅读“如 
何学习线性代数”， 在学习 1.4 节和 1.7 节时，再按照“ 掌握线性代数概念” 的指导去做.我的 
学生认为这些建议很有帮助，希望你也有同感.献上最好的祝愿. 
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第 1 章线性代数中的线性方程组 


介绍性实例经济学与工程中的线性檳型 


1949年岌末.哈佛大学教授列昂惕夫 ( Wassily Leontief ) 正在小心 
地将最后一部分穿孔卡片插人大学的 Mark IT 计算机.这些卡片包含了美 
国经济的信息，包括了美国劳动统计局两年紧张工作所得到的总共25万 
多条信息.列昂惕夫把美国经济分解为500个部门，例如煤炭工业、汽车 
T ： 业、交通系统等等.对每个部门，他写出了一个描述该部门的产出如何 
分配给其他经济部门的线性方程.由于当时最大的计算机之一的 Markn 
还不能处理所得到的包含500个未知数的5⑻个方程的方程组，列昂惕 
夫只好把问题简化为包含42个未知数的42个方程的方程组. 

为解列昂惕夫的42个方程，编写 Markll 计算机上的程序需要几个 
月的工作，他急于知道计算机解这个问题需要多长时间. Markn 计算机运 
算了 56个小时，才得到最后的答案.我们将在 1.5 节和 2.7 节中讨论这个 
解的性质. 

列昂惕夫获得了 1973年诺贝尔经济学奖，他打开了研究经济数学模型的新时代的大门.1949年在哈 
佛的工作标志看应用计算机分析大规模数学模型的开始.从那以后，许多其他领域中的研究者应用计算机 
来分析数学模型.由于所涉及的数据数量庞大.这些模型通常是线性的，即它们是用 线性方程组描 述的. 

线性代数在应用中的重要性随着计算机功能的增大而迅速增加，而每一代新的硬件和软件引发了对 
计算机能力的更大 需求. 因此，计算机科学就通过并行处理和大规模计算的爆炸性增长与线性代数密切联 
系在一 •起. 

科学家和工程师正在研究大贵极其复杂的问题，这在几十年前是不可想象的.今天，线性代数对许多 
科学技术和工商领域中的学生的重要性可说超过了大学其他数学 课程. 本书中的材料是在许多有趣领域 
中进一步研究的基础.这里举出几个例子，以后将列举其他一些领域. 

• 石油探測. 当勘探船寻找海底石油储藏时.它的计算机每天要解几千个线性方程组.方程组的地震 
数据从气喷枪的爆炸引起水下冲击波获得 • 这些冲击波引起海底岩石的震动，并用几英里长的电缆 
拖在船后的地震测波器采集数据. 

• 线性 规划. 许 多重要的管理决策是在线性规划模型的基础上作出的，这些模型包含几百个变蛰， 
例如，航运业使用线性规划调度航班，监视飞机的飞行位置，或计划维修和机场运作 • 

• 电路 • 工程师使用仿真软件来设计电路和微芯片，它们包含数百万的晶体管.这样的软件技术依赖 
于线性代数与线性方程组的方法. 
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第]章 


线性方程组是线性代数的核心，本章使用它来引人线性代数的许多重要概念_ 1.1 节和 1.2 
节介绍求解线性方程组的一个系统方法，这个算法在全书的计算中都用到. 1.3 节和 1.4 节指出 
线性方程组等价于 一个向量方程与矩阵方程. 这种等价性把向量的线性组合问题化为线性方程 
组的问题.线性表示，线性无关和线性变换的基本概念将在本章后半部分研究，它们在整本书 
中起着关键的作用，并使我们体会到线性代数的魅力和威力. 


1.1 线性方程组 

包含未知数 x u x 2 ,---, x „ 的一个线性方程是形如 

flix , + a 2 x 2 H — + a „ x „ = b (1) 

的方程，其中与系数 fll , a 2 ，… ，〜是 实数或复数，通常是已知数.下标 n 可以是任意正整数.在 
本书的例题中， n 通常是在2与5之间.在实际问题中， n 可以是50, 5000或更大. 

方程 

4 x , - 5 x 2 +2 = 々和; c 2 = 2 (-^ 6 - x ,) + x } 

都是线性方程，因为它们可以化为 

3 jt , - 5 x 2 - -2 和 2 a + x 2 -Xi = 2 y /6 

方程 

4 x t - 5 x 2 - •* 1 ; c 2 和 x 2 = 2- v /^ i "-6 

都不是线性方程，因为第-个方程中包含;第二个方程中包含 

线性方程组是由一个或几个包含相同变量; ChA ，. ••，；(„ 的线性方程组成的.例如， 

2 x i - x 2 + 1 . 5 x } = 8 ⑴ 

x t - 4xi = -1 

线性方程组的一组解是一组数(^七，… A ), 用这组数分别代替; C ,，； C 2 ，…， A 时所有方程的两边相 
等.例如，方程组 （2) 有一组解(5, 6.5, 3)，这是因为，在 （2) 中用这些值代替 AAA 时， 
方程组变成等式8=8和 -7 = -7 . 

方程组所有可能的解的集合称为线性方程组的 解集. 两个线性方程组称为等价的.若它们 
有相同的解集.就是说，第一个方程组的每个解都是第二个方程组的解，第二方程组的每个解 
都是第一方程组的解. 

求包含两个未知数的两个方程组成的方程组的解，等价于求两条直线的交点.一个典型的 
例子是 

x , - 2 x 2 =-1 
- x , + 3 x 2 = 3 

这两个方程的图形都是直线，用/,和/ 2 表示，数对(心& ) 满足这两个方程当且仅当点(^，心 ） 是 
这两条直线的交点.容易验证，这个方程组有惟一的解 (3, 2)，如图 1-1 所示. 

当然，两条直线不一定交于一个点，它们可能平行，也可能重合，重合的两条直线上的每 
个点都是交点.图 1-2 是与下面两个方程组对应的 图形： 



线性代数中的线性方程组 
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a ) x , - 2x 2 = -1 b ) x , -2x 2 = -1 

- x , + 2 x 2 =3 - x , + 2 x 2 = 1 

图 1-1 和图 1-2 说明线性方程组的下列一般事实，这将在 1.2 节证明. 


线性方程组的解有下列三种 情况： 

1. 无解. 

2. 有惟一解. 

3. 有无穷多解. 


我们称一个线性方程组是相容的，若它有一个解或无穷多 个解； 称它是不相容的，若它无 
解 • 




矩阵记号 


一个线性方程组包含的主要信息可以用一个称为矩阵的紧凑的矩形阵列表示.给出方程组 
x, -2 x 2 + a = 0 

2 ^ - 8 ^= 8 ( 3 ) 
-4々 + 5^2 + 9 jc 3 = -9 

把每一个变量的系数写在对齐的一列中，矩阵 


■ 1-2 I 
0 2-8 
^ 5 9 
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称为方程组 （3) 的系 数矩阵 ，而 

' 1-2 1 0 ' 

0 2 -8 8 ⑷ 

-4 5 9 -9 

称为它 的增广 矩阵. （第二行第一个元素为0，因第二个方程可写成 0.;+2 jc 2 -8 jc 3 =8.) 方程组 
的增广矩阵是把它的系数矩阵添上一列所得，这一列是由方程组右边常数组成的. 

矩阵的维数说明它包含的行数和列数.上面的增广矩阵 （4) 有3行4列，称为 3 x 4 &读作 
3行4列）矩阵.若是正整数，一个 mxn 矩阵是一个有 m 行”列的数的矩形阵列 .（ 行数写 
在前面 .） 矩阵记号为解方程组带来方便. 

线性方程组的解法 

本节和下一部分给出了解线性方程组的一般方法.基本的思路是把方 程组用一个更容易解 
的等价方程组（即有相同解集）代替. 

粗略地说，我们用方程组中第一个方程中含;^的项消去其他方程中 的含々 的项.然后用第 
二个方程中含 々的项 消去其他方程中含; c 2 的项，依此 类推. 最后我们得到一个很简单的等价方 
程组. 

用来化简线性方程组的三种基本 变换： 把某一个方程换成它与另一方程的倍数的和；交换 
两个方程的 位置； 把某一方程的所有的项乘以一个非零常数.在例1之后，我们将说明经过这 
三种变换，为什么不改变方程组的解集. 

例 1解方程组 (3). 

解 我们在消去未知数的同时用方程组与相应的矩阵形式表示出来以便比较. 
x , -2 x 2 + xj = 0 1-2 1 0 

2x 2 -8x } = 8 0 2 -8 8 

-4; t ,+5; c 2 +9; c 3 =-9 [-4 5 9 -9 

保留第一个方程中的; d , 把其他方程中的; ^ 消去. 为此，把第1 个方 程乘以4,加到第3个方 
程上.熟练之后可以通过心算 完成： 

4•[方程 1]: 4 xi - Sx 2 + 4 xi = 0 

+[方程 3] : -4 x , +5 a : 2 + 9 xj = -9 

[新方程 3]: ~~-3^ 2 +13^3=-9 

把原来的第三个方程用所得新方程 代替： 

Xi -2 x 2 + x 3 = 0 1-2 1 0 

2 x 2 - 8^= 8 0 2 -8 8 

-3^+13^ =-9 L ° ~ 3 13 -9. 

其次，把方程 2 乘以1/2,使; c 2 的系数变成 1. 

Xi - 2x 2 + ^3=0 1-2 1 0 

x 2 - 4^3 = 4 0 1-4 4 

-3^2+13^3 =-9 [0-3 13 -9 
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利用方程 2 中的 jc 2 项消去方程 3 中的项 -3jc 2 ， 用心算计算 如下： 


3 ■[方程3 
+[方翻 


[新方程 3]: 

所得的新方程组有三角形形状 ： e 

jcj-2jc 2 + jc 3 =0 
x 2 -4jc 3 =4 
=3 


3jc 2 -12jc 3 =12 
一 3jc 2 +13jc 3 =-9 
x 3 = 3 


—2 


现在我们想消去第一个方程中的项 - 2 xi ，不过先利用方程 3 消去第一个方程中的项和第二个 
方程中的项 -4 jc 3 更为有效.这两个运算 如下： 


4 ■[方程 S 
+[方程 2] 


4 ^, =12 

!-4 為 = 4 


-1. [方程 3]: 
+[方程 1]: 
[新方程 1]: 


—Xj = — 3 
l -2x 2 +x i = 0 


: -3 


[新方程 2]: x 2 =16 [新方程 1]: x ,- 2 x 2 

这两次变换的结果 如下： 

X, -2x 2 =-3 「 1-2 0-3. 

x 2 =16 0 1 0 16 

jc,= 3 [o 0 1 3 

现在，在 jc 3 的一列中只剩一项，我们回头来消去第一个方程中的; c 2 项.把方程2的2倍加到方 
程1,得到方 程组： 


Xi 

= 29 

•10 0 

29' 

A 

2 =16 

0 1 0 

16 


4=3 

0 0 1 

3 


我们已经得出 结果： 原方程组的惟一解是 (29,16, 3), 我们做了这么多计算，最好还是检验一下 
结果.为证明 (29, 16,3) 是方程组的解，把这些值代人原方程组的 左边： 

(29)-2(16)+ (3) = 29- 32 +3 = 0 
2(16)-8(3) = 32 - 24 = 8 

-4(29)+5(16)+9(3) = -1 16+80+27 = -9 + 

结果与原方程组右边相同，所以 (29, 16, 3> 是原方程组的解（见图 1-3). 



图 1-3 每个方程确定三维空间中的一个平面.点 (29, 16, 3) 落在三个平面上 


© 直观的词••三角形”将在下节替代为更稍碗的术语. 
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例1说明了线性方程的变换对应于增广矩阵的行的变换.前面所讲的三种基本变换对应于 
增广矩阵的下列变换. 


行初等变换 

1. ( 倍加变换）把某一行换成它本身与另一行的倍数的和 0 

2. ( 对换变换）把两行对换. 

3. (倍乘变换）把某一行的所有元素乘以同一个非零数. 


行变换可施行于任何矩阵，不仅是对于线性方程组的增广矩阵.我们称两个矩阵为行等价 
的，若其中一个矩阵可以经一系列行初等变换成为另一个矩阵. 

重要的一点是行变换是可逆的.若两行被对换，则再次对换它们就会还原为原来的状 
态.若某一行乘以非零常数 C , 则将所得的行乘以 1/ C 就得出原来的行.最后，考虑涉及两 


行的倍加变换，例如第一行和第二行.假设把第一行的 c 倍加到第二行得到新的第二行， 


那么“逆”变换就是把第一行的 - c 倍加到（新的）第二行上就得到原来的第二行.见本节 


末习题 29-32. 


此时，我们更关注对一个线性方程组的增广矩阵进行行变换.假设一个线性方程组经过行 
变换变成另一个新的方程组，考虑每一种行变换，容易看出，原方程组的任何一个解仍是新的 
方程组的一个解.反之，因原方程组也可由新方程组经行变换得出，新方程组的每个解也是原 
方程组的解.这就证明了下列事实. 


| 若两个线性方程组的增广矩阵是行等价的，则它们具有相同的解集. 


虽然例1看起来很长，经过一些练习你还是可以很快掌握的.本书中习题的行变换通常是 
很简单的，因而你可以集中精力理解其中的思想和 概念. 当然你必须熟练掌握这些变换，因为 
整本书都要用到它们. 

本节的其他部分将介绍如何利用行变换来确定解集的情况，而无需完全求出解来. 


存在与惟一性问题 


在 I . 2 节中我们将会知道，为什么一个线性方程组的解集可能不包含任何解，一个解或无 
穷多个解.为确定某个方程组属于哪种情况，我们提出以下两个问题. 


线性方程组的两个基本问题 

1. 方程组是否相容，即它是否至少有一个解？ 

2- 若它有解，它是否只有一个解，即解是否惟一? _ 

这两个问题将在整本书中以各种形式 出现. 本节与下节中，我们将说明如何通过增广矩阵 
的行变换来回答这些问题. 


© 通常把倍加变换 说成： “把某一行的倍数加 a 另一行上”. 
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例2确定下列方程组是否有解 

xi-2x 2 + x 3 = 0 
2 x 2 - Sx 3 = 8 
^!+5^2+9^3 =-9 

解这就是例1 中的方程组.设我们已把方程组通过行变换变成三角形 
^1-2^2+ x 3 =0 「 1-2 1 0 " 

X2 -4x 3 =4 0 1 -4 4 

x 3 =3 [0 0 13 

这时我们已经确定了: c 3 , 若我们把: c 3 的值代入方程2,我们就会确定: c 2 , 因而可由方程1确定 
所以解是存在的，即该方程组是相容的.（事实上， A 由方程2惟一确定，而; c , 由方程1惟 
一确定，所以解是惟一的 .） ■ 

例3确定下列方程组是否 相容： 

x 2 - 4^3 =8 

2 :ci - 3 jc 2 +2: c 3 =1 (5) 

5jci-8jc 2 +7jc3 =1 

解增广矩 阵为： 

"0 1 -4 8" 

2-321 
5-8 7 1 

为使第一个方程包含 A 项，对换第一行与第 二行： 

■2-3 2 1' 

0 1 -4 8 

5-8 7 1 

为消去第3个方程的项 ， 把第1行的 -5/2 倍加到第3 行： 

2-3 2 1 ' 

0 14 8 ( 6 ) 

0 -1/2 2 -3/2 

其次，用第二个方程的; c 2 项消去第三个方程的 -(1/2)4 项，把第2行的1/2倍加到第3 行上： 

"2 -3 2 1 ' 

0148 ( 7 ) 

0 0 0 512 - 

现在增广矩阵已成为三角形，我们来说明这个矩阵.化为方程 表示： 

2jci-3jc 2 +2jc3 =1 

^2-4^3 =8 (8) 

0 = 5/2 

方程0=5/2是 0々+( k 2 +( k 3 =5/2 的 简写. 这个三角形线性方程组显然是矛盾的，所以满足 （8) 
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的未知数 〜4,4的值是不可能存在的， 因等式0=5/2不可能 成立. 由于 （8) 和 （5) 有同样的 
解集，原方程组是不相容的（即无解），见图 U 4. 


图 1-4 该方程组是不相容的，因为没有同时落在三个平面上的点 ■ 

注意 （7) 的增广矩阵，它的最后一行在三角形不相容方程组中是典型的. 



数值计算的注解 在实际问趙中线性方程组是通过计算机求解的.对于方阵，计算机 
程序基本上是应用这里以及 1.2 节的消去法，稍作修正以改进精确度. 

工商业中的大量线性代数问题运用浮点运算求解，数表示为小数 形式： 
± d , … AxKT , / ■是整数，而小数点右面的数位为 8 至 16 位. 这种数的算术运算一般 
是有误差的.其结果必须四舍五入（或舍去）为存储时需要的数位.“舍入误差”在输 
入像 1/3 这样的数时也会产生，因为它必须用近似的有限位小数表示 • 幸运的是，浮 
点运算中的不精确性很少引起严重问题.本书中关于数值计算的注解将会提醒你注意 
这些问题. 

练习题 


本书中练习题应该在做习题之前完成，它们的解答在每一节习题之后给出. 

1. 用语言叙述解每个方程组时下一步应做的行变换. 

a. x,+4x 2 -2^3+8jc 4=12 b. jq-3x 2 +5 jc 3 -2jc 4 = 0 

x 2 -7x 3 -¥2x4 = -4 x 2 +8jc 3 =-4 

5jt 3 - x 4 = 7 2 jc 3 = 3 

x 3 +3 jc 4=-5 X 4= 1 

2. 某线性方程组的增广矩阵已经由行变换化为以下形式.确定它是否有解. 

■15 2 - 6 ' 

0 4-7 2 

0 0 5 0 

3. 数组(3, 4, -2) 是否为下列方程组 的解： 

5 xi - jc 2 + 2« x 3 = 7 
-2jq+6 x 2 +9jc 3 = 0 
—7xi + 5jc 2 - 3x 3 = -7 

4. 当 A 和 A 取何值时下列方程组相容？ 

2 xi - x 2 = h 
-6jq +3x 2 = k 
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习题 1.1 

利用对方程或增广矩阵的行初等变换解 1-4 
题中的方程组.依照本节中给出的消去过程. 

1 X\ + 5x2 = 7 
- 2 xi - lx 2 =-5 

2. 2x x +4 x 2 ~-4- 
5 jci +7 jc 2 = 11 

3. 求在直线 x x + 5 x 2 = l $\ x r 2 x 2 =-2 上的点 ( x u x 2 ), 
见下图. 



4. 求直线 4-54=1 与 3 jc ,-7 jc 2 =5 的交点. 

习题5、6中的矩阵是某个线性方程组的增广 
矩阵.说明在解方程组时下一步应进行的行初等 
变换. 


5. 


"1 -4 5 0 7' 

0 1-306 

0 0 10 2 

0 0 0 1 -5 


■ i_6 4 0 - r 

0 2 -7 0 4 

0 0 12-3 

0 0 3 1 6 

在7~10题中某个线性方程组的增广矩阵已由 
行变换化成如下所示，继续进行适当的行变换并说 
明原方程组的解集. 

'17 3 -4 

0 1-13 
7 . 0 0 0 1 
0 0 1-2 


8. 


'1 -4 9 0' 
0 17 0 

0 0 2 0 


9. 


10 . 


"1-10 0 -4 

0 1-3 0-7 

0 0 1 -3 -1 

0 0 0 2 4_ 

■1 -2 0 3 -2 

0 10-4 7 

0 0 10 6 
0 0 0 1 -3- 


解11~14题的方 程组： 

11. jc 2 十 4jc 3 = -5 

jc, 十 3jc 2 +5jc 3 =-2 

3jc,+7jc 2 +7jc 3 = 6 

12. jc, - 3x 2 + 4jc 3 = ^ 

3jcj — 7jc2 + 7jc3 = —8 

+ 6x 2 - x 3 = 1 

13. JCi - 3 jc 3 = 8 


2 xj + 2 x 2 + 9 x 3 = 


x 2 + 5 jc 3 = -2 

14. jc , - 3 jc 2 =5 
-jci + jc 2 + 5 x 3 = 2 
x 2 + jc 3 =0 


确定 15~16 题中的方程组是否相容，不必解岀 


方程组. 

15. 4 +3^ = 2 

jc 2 - 3 x a = 3 
- 2 jc 2 + 3 x 3 + 2 jc 4 = 1 
3 jcj +7 jc 4 =-5 

16. 文！ - 2 x a = —3 

2x 2 十 2jc 3 =0 
x 3 + 3 x 4 = 1 
- 2 xi + 3 x 2 + 2 jc 3 + x 4 - 5 

17. 三条直线 x x - 4 x 2 = 1, - jc 2 =-3 和 - jc ,- 

3 ； c 2 =4 是否有一个交点？请解释. 

18. 三条直线 jci + 2 x 2 + x 3 = 4 t x 2 - x 3 - I ^ Ojc , + 
3々=0是否有至少一个交点？请解释. 

在 19-22 题中，确定 A 的值使矩阵是某一个相 
容方程组的增广 矩阵： 
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在 23-24 题中，或是直接引用本节的重要命 
题，略为改述（但依然成立），或被错误修改.判 
断每个命题的真或假并给出理由.（若判断为真， 
指出教材中相似命题的出处，或参考的定义、定理. 
若判断为假，指出引用或用错的命题出处，或举例 
说明 .） 类似的真/假问题会在本教材的许多章节中 
出现. 

23. a . 每个行初等变换为可逆的. 

b . 5 x 6 矩阵有6行. 

c . 包含 n 个变置為，為,…, jc , 的线性方程组的解 
集是一组数 ( s , 当用这组数代替 
知仏…,*,时，方程组中每个方程成为恒等 
式. 

d . 线性方程组的两个基本问题涉及存在性和 
惟一性. 

24. a . 对增广矩阵的行初等变换不改变相关的线性 

方程组的解集. 

b . 两个矩阵是行等价的，若它们有相同的行 
数. 

c . 不相容方程组的解多于一个. 

d _ 两个线性方程组是等价的，若它们有相同的 
解集. 

25. 求出包含心 A 和 ifc 的方程组，使以下矩阵是 
相容方程组的增广矩阵. 

' 1 ^ 7 g 

0 3-5 /z 

-2 5 -9 k 

26. 给解集为 jc l =-2, jt 2 = l . J t 3 =0 的线性方程组构 
造三个不同的增广矩阵. 

27. 设下面的方程组对所有/和 g 的可能取值都是 
相容的，则系数 c 和 d 有何特性？给出理由. 


jc,+3jc 2 =/ 
cjc,+ dr 2 = g 

28. 设为常数，不为零，下面的方程组对 
所有 f 和 g 的可能取值都是相容的，则系数 

有何特性？给出理由. 
ax, +bx 2 = f 
cx,+dx 1 = g 

在 29~32 题中，求出把第一个矩阵变为第二个 
矩阵的行初等变换，并求出把第二个矩阵变为第一 
个矩阵的逆行初等变换. 

—0-2 5] |"1 4 -7' 

29. 1 4 -7 , 0 -2 5 

3 -1 6 J [3 -1 6 



1 -2 1 0 l fl -2 l O ' 

31. 0 5 -2 8,0 5 -2 8 

.4-1 3 -6j [o 7-1-6 

1 2-5 0] [1 2-5 O' 

32. 0 1 -3 -2 , 0 1-3-2 

.0 -3 9 sj [o 0 0 -1 

热传导的研究中，重要问题是确 定某一 块平板 
的稳态温度分布，假设已知边界上的温度分布，假 
设下图中的平板代表一条金属梁的 截面忽 略垂直 
于该截面方向上的热传导，设 7!, r 2 , …,7；表示图中 
4个内部结点的温度.某一节点的温度近似地等于 
4个与它最接近的结点（上、下、左、右）的平均 
值®，例如 

Tt =(10+20 +Zi +7；)/4或 47 J -7 i - r 4 =30 


20° 20。 



0 桊阅 Heat and Mass Tranter, F. M. While, 
Addison- Wesley Publishing, 1991, pp. 145-149. 
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33. 写出温度 7 I . r 2 , …,7；所满足的方程组. 计算.在对换变换之前先对换第1行和第 4 

34. 解习题33中写出的方程组 .（ 提示： 为快速 行 . > 

练习题答案 

1. a . 手工计算时，最好是把方程3与4对换，另一种办法是把方程3乘以1/5,或把方程4化为它与方程 

3的 -1/5 倍的和 （ 不要利用方程2中的為项消去方程1中4* 2 ,而要等到得到三角形矩阵且 x 3 ，知项 
已从前2个方程消去之后）. 

b . 方程组已是三 角形. 进一步的简化可利用第四个方程中的项消去它上面的各个&项，现在适当的 
步骤是把方程4的2倍加到方程1上 （ 此后再把方程3乘以1/2,再消去其他的 x 3 项）. 

2. 对应于该增广矩阵的方程组是 

jci+5x 2 + 2jc 3 =-6 
4jc 2 -7j ：3= 2 
5 x 3 = 0 

由第三个方程得到 x 3 =0, 这当然是允许的.消去前两个方程中的為项，我们可以继续求出方程 
组的惟 一解. 因此解是存在且惟一的.注意比较本题与例 3. 

3. 容易检验一组数是否方程组的解.把為=3» Jt 2 =4 和 jc ,=-2 代人方程组，求得 

5(3) - (4)+2(-2)= 15 - 4 - 4 = 7 
-2(3)+6(4)+9(-2)= -6+24-18 = 0 
-7(3) + 5(4) - 3(-2) = -21+20+ 6 = 5 

虽然前两个方程满足了，但不满足第三个，所以 (3, 4, -2) 不是方程组 的解. 注意代人时我们使 
用了括号.建议你这么做是为了避免错误，见图 1-5. 

图 1-5 因为 (3 A -2) 满足前两个方程，所以它落在前两个平面的交线上. 

因为(3.4,-2)不满足所有三个方程，所以它没有落在三个平面上 

4. 第二个方程代以它与第一个方程的3倍的和.方程组化为 

lJk-x 2 -h 

0 =灸 + 3/| 

若 + 非零，该方程组无解.所以方程组对任意满足 fc +3 /i = 0 的/ I 和 ifc 的值有解. 
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1.2 行化简与阶梯形矩阵 

本节我们将 1.1 节中的方法进一步精确化，编成行化简算法（也称行消去法），它可用来解 
任意线性方程组. e 而应用算法的第一部分，我们可以回答 1.1 节中提出的基本存在与惟一性问 
题 

这种算法可用于任意矩阵，不管它是否为某一方程组的增广矩阵.所以本节的第一部分讨 
论任意矩阵.首先我们引人两类重要的矩阵，它们包含 1.1 节中的“三角”矩阵，在以下的定 
义中，矩阵中非家行或列指矩阵中至少包含一个非零元素的行 或列； 非零行的先导元素是指该 
行中最左边的非零元素. 

定义一个矩阵称为阶梯形（或行阶梯形），若它有以下三个 性质： 

1. 每一非零行在每一零行 之上； 

2. 某一行的先导元素所在的列位于前一行先导元素的右面； 

3. 某一先导元素所在列下方元素都是零.若一个阶梯形矩阵还满足以下性质，称它为简化 
阶梯形 （ 或简化行阶梯形）. 

4. 每一非零行的先导元素是1; 

5. 每一先导元素1是该元素所在列的惟一柞零元素. 


若一个矩阵具有阶梯形 （ 简化阶梯形），它就称为阶梯形 （ 简化阶梯形）矩阵.性质2说明 
先导元素构成阶梯形.性质3其实是性质2的推论，不过我们把它列出来以示强调. 

1.1 节中的“三角”矩阵，如 


•2-3 

0 1 

2 1 

-4 8 

和 

•1 

0 

0 0 

10 

29 

16 

0 0 

0 5/2 


0 

0 1 

3 


都是阶梯形的，第二个矩阵是简化阶梯形的.再举更多的例子. 

例1下列矩阵都是阶梯形的，先导元素用 ■ 表示，它们可取任意的非零值，在*位置的元 
素可取任意值，包括零值. 


0 ■冰 ♦氺 ♦♦本 _ 本 



下列矩阵是简化阶梯形的，因先导元素都是1,且在每个先导元素1的上、下，各元素都是 0. 


© 我们的算法通常称为高斯消去法.类似的消去法大约在公元前250年由中国数学家应用.这种方法在西方直到19 
世纪才由著名*国数学家 C . F . 高斯发现.德国工程师 W . 约当把它写在1988年的一本测地学著作中，这种方法才 
被普及. 
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01 * 000 ** 0 * 

000100 ** 0 * 

000010 ** 0 * 

000001 ** 0 * 
000000001 * 

一个矩阵可以行化简 （ 即用行初等变换）变为阶梯形矩阵，但用不同的方法可化为不同的 
阶梯形矩阵.然而，一个矩阵只能化为惟一的简化阶梯形矩阵.下列定理将在书末附录 A 中给 
出证明. 

定理1 (简化阶梯形矩阵的惟一性） 

每个矩阵行等价于惟一的简化阶梯形矩阵. 

若矩阵 A 等价于阶梯形矩阵 I /，称1/为 A 的阶梯形（或行阶梯 形）； 若 t ; 是简化阶梯形， 
称1/为 A 的简化阶 梯形. 大部分矩阵程序用 RREF 作为简化（行）阶梯形的缩写，有些用 REF 
作为（行）阶梯形的缩写. 

主元位置 

当矩阵经行变换化为阶梯形后，经进一步的行变换将矩阵化为简化阶梯形时，先导元素的 
位置并 不改变 • 因简化阶梯形是惟一的， 当给定矩阵化为任何一个阶梯形时，先导元素总是在 
相同的位置上. 这些先导元素对应于简化阶梯形中的先导 1. 

定义矩阵中 的主元位置是 A 中对应于它的阶梯形中先导元素的位置. 主元列是 A 的含有 
主元位置的列. 

在例1中，符号 （■) 对应主元位置.下面四章中许多基本概念与矩阵中主元位置都有联 
系 • 

例2把下列矩阵 A 用行变换化为阶梯形，确定主元列. 

0-3-6 4 9 

-1 -2-1 3 1 

-2 -3 0 3 -1 

1 4 5-9-7 

解利用」 .1 节的 方法. 最左边的非零列的第一个元素就是第一个主元 位置. 这个位置必 
须放一个非零元，即主 元素. 最好将第一行与第四行对换，这样可以避免分数运算 • 

P - 主元 

I + J4 5 -9 -7' 

-1 -2-13 1 

-2 -3 0 3 -1 
0-3-6 4 9 

[ 主元列 

把第一行的倍数加到其他各行，以使主元1下面各元素变成 0. 第二行的主元位置必须尽量靠 
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左，即在第 二列. 我们选择这里的2作为第二个主元. 

14 5 -9-7 

0 2山 -6-6 

0 5 10 -15 -15 

0-3-6 4 9 

t _ 新的主元列 

把第二行的 -5/2 倍加到第三行，3/2倍加到第4行. 

"14 5-9 -7' 

0 2 4 0 (2) 

0 0 0 0 0 

0 0 0 -5 0 

(2) 中的矩阵与 1.1 节所遇到的不同，这里没有办法在第3列中找到先导元素！我们不能 
利用第一行或第二行，否则会破坏已产生的阶梯形的先导元素的排列.然而若我们对换第3行 
和第4行，我们可在第4列产生先导元素. 


14 5—9 
0 2 4 -6 
0 0 0 - 5 ^ 
0 0 0 


主元 


-6 
0 
0 

主元列 


0 ■ * * * 
0 0 0 "* 
0 0 0 0 0 


此矩阵已是阶梯形.第1、2、4列是主元列. 



(3) 


■ 


如例2所示，主元就是在主元位置上的非零元素，用来通过行变换把下面的元素化为0， 
例2中的主元是1，2, -5,注意这些元素与矩阵 A 中同一位置的元素不相同，如 （3) 式所示. 
事实上，用不同的行变换可能产生不同的主元.为方便起见，常把矩阵的各行乘以一个数使先 
导元素变成 1. 

根据例2,我们给出一个有效的算法，变换矩阵成阶梯形或简化阶梯形.认真掌握这一算法 
将使你获益匪浅. 


行化简算法 

下列算法包含四个步骤，它产生一个阶梯形矩阵，第五步产生简化阶梯形矩阵.我们用一 
个实例来说明这一算法. 




线性代数中的线性方程组 


例 3 用行初等变换把下列矩 f 

解 

毕先化为阶梯形， 再化: 
'0 3 -6 6 4 -5 

3 -7 8 —5 8 9 

3 -9 12 -9 6 15 

为简化阶梯形. 

| 第一步，由最左的非零列 开始. 这是一个主元列_主元位置在该列顶端. | 


'0 3 -6 6 4 -5' 

3 -7 8 -5 8 9 

3 -9 12 -9 6 15 

t 主元列 ' 


弟二步，在主元列中选取一个非零元作为 主元. 若有必要的话，对换两行使这个元素移 
到主元位置上. 

对换第 1、3 两行（也可对换 1、 2 i 

两行） 

1—主元 

"3< J -9 12 -9 6 15' 
3 -7 8 -5 8 9 
— 0 3 -6 6 4 -5 


| 第二步，用倍加行变瓣主元 T 麵元素变成 0. ' | 

我们当然可以把第 1 行除以主元 3. 
行. 

但这里第 1 列有两个 3, 

p 主元 

3< J -9 12 -9 6 15" 
0 2 ^ 4 2-6 

0 3 -6 6 4 -5 

我们只需把第 1 行的 -1 倍加到第 2 

弟四步，暂时不管包含主兀位置的行以及它上面的各行，对剩下的子矩阵使用上述的= 
个步骤直到没有非零行需要处理为止. — 


暂时不看^-行，第-步指出，帛2列是下-个主元列，帛二步，我们选择该列中 “ 顶端，，的元 
素作为主元. 



0 3 -6 6 4 -5」 

^—新主元列 



对第三步，我们可先把子矩阵的"顶行”除以主元 2. 不过也可以把这一行的 -3/2 倍加到下面 
的一行.这就得到 


3 -9 12 6 15 

0 2 4 2-6 


暂时不看第二个主元所在的行，我们剩下一个只有一行的新子矩阵. 


3 -9 12 -9 6 15 
0 2 -A 4 2-6 


新的子矩阵已不需要处理了，我们已得到整个矩阵的阶梯形.若我们需要简化阶梯形，进行下 
一个步骤. 

第五步，由最右面的主元开始，把每个主元上方的各元索变成 0. 若某个主元不是丨，用 
倍乘变换将它变成 1. _ 

'3 -9 12 -9 0 -91 —行 1+(-6) •行3 

0 2 -4 4 0 -14 ■< -衍+(-2> •行3 

0 0 0 0 1 4 

下一个主元在第2行，将这行除以这个主元. 

p -9 12 -9 0 -9] 

0 1 -2 2 0 -7 行乘以 1/2 


将第2行的9倍加到第1行 


3 0 -6 9 0 -72 •< -行 1+9 •行 2 
0 1 -2 2 0 -7 


最后将第1行除以主元3 

1 0 -2 3 0 -24' 

0 1 -2 2 0 -7 ― 行乘以 1/3 

0 0 0 0 1 4 

这就是原矩阵的简化阶梯形. ■ 

第1~4步称为行化简算法的向前 步隳， 产生惟一的简化阶梯形的第5步，称为向后步嫌. 


数值计算的注解 在第 2 步中，计算机程序通常选择一列中绝对值最大的元素作为主 
元. 这种方法通常称为 部分主元法， 可以减少计算中的舍入误差. 
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线性方程组的解 


行化简算法应用于方程组的增广矩阵时，可以得出线性方程组解集的一种显式表示法. 


例如，设某一个线性方程组的增广矩阵已经化为等价的简化阶梯形 
"1 0 -5 1" 

0 1 14 

0 0 0 0 

因为增广矩阵有4列，所以有3个未知数，对应的线性方程组是 
-5^3 = 1 

x 2 + Xi =4 (4) 

0 =0 

对应于主元列的变量 A 和; c 2 称为基 本变置 0 其他变量如; c 3 , 称为自由 变置. 

当一个线性方程组是相容的，如方程组 （4) 解集可以用显式表示，只要把方程的简化形式 
解出来，用自由变量表示基本变量 即可. 由于简化阶梯形使每个基本变量仅包含在一个方程中， 
这是很容易的.在方程组 （4) 中，我们可由第1个方程解出; c ,， 第2个方程解出; c 2 (第3个方 
程对未知数没有任何限制，可以不管它）. 


i ^l =1 + 5^3 

^2 =4-^3 (5) 

A 是自由变量 

我们说4是自由变量，是指它可取任意 的值. 当; c 3 的值选定后，由 （5) 中的前2个方程就可 
以确 定為和 A 的值，例如，当; c 3 =0, 得出解 （1, 4 , 0); 当; c 3 = l ， 得出解（6, 3, 1), ; c 3 的 
不同选择确定了方程组的不同的解，方程组的每个解由; c 3 的值的选择来确定. 

(5) 式给出的解称为方程组的通解，因为它给出了所有解的显式表示. 

例4求方程组的解，该方程组的增广矩阵已经化为 


16 2-5 -2 
0 0 2 -8 -1 


[0 0 0 0 1 

—解该矩阵已是阶梯形，但我们在解出基本变量前^需把它化为简化阶梯形，记号 
表示它前面和后面的两个矩阵是行等价的（译 者注： 该记号在中文教科书中并未通用）. 

6 2 -5 0 10" 


.16 2-5-2 -4 
0 0 2 -8 -1 3 

0 0 0 0 1 7 

.1 6 2 -5 0 10 
0 0 1-40 5 

0 0 0 0 1 7 


0 0 2 -8 0 1 ( 

0 0 0 0 1 ' 

1 6 0 3 0 0 

0 0 1 -4 0 5 

0 0 0 0 1 7 


增广矩阵有6列，所以原方程组有5个变量，对应的方程组为 


© 某些书称为先导变量，因为它们对应于包含先导元索的主元列. 



18 


Xi + 6^2 +3^4 =0 

文3 -4^4 =5 


第1聿 


矩阵的主元列是第1，3, 5列，基本变量为; C,, A, 剩下的变量; c 2 和; c 4 为自由变量，解 

出基本变量，我们得通解为 

x, =-6 x 2 -3x 4 
A 为自由变量 

.; c 3 = 5 + 4 x 4 ( 7 ) 

A 为自由变量 
x 5 =l 

注意，由方程组 （6) 的第3个方程，七的值是确定的. ■ 

解集的参数表示 

解集的表示式 （5) 和 （7) 称为解集的参数表示，其中自由变量作为参数.解方程组就是 
要求出解集的这种参数表示或确定它无解. . 

当一个方程组是相容的，且具有自由变量，则它的解集具有多种参数表示.例如，在方程 
组 （ 4 ) 中，我们可以把方程2的5倍加到方程1,得等价方程组 
Xi + 5 j ：2 =21 

x 2 +x 3 = 4 

这时可把; c 2 看作参数，用; c 2 表示; c , 和; c 3 , 得到解集的第一种表示法.不过，我们总是约定 
使用自由变量作为参数来表示解集（本书末尾的习题解答也采用这一约定）. 

当方程组是不相容时，解集是空集，无论方程组是否有自由变量，此时，解集无参数表示. 

回代 

考虑下列方程组，它的增广矩阵已是阶梯形，但还不是简化阶 梯形： 

Xi~lx 2 + 2x } - 5 j ：4 + 8 j ：5 = 10 
x 2 - 3x } + 3 x 4 + x s =-5 
x 4 - x s = 4 

计算机程序通常用回代法解此方程组，而不是求它的简化阶梯形.就是说，程序先解第3 
个方程，用; c 5 表示; c 4 , 并把此表达式代人第2个方程，从中解出; c 2 , 最后把&和;( 4 的表达式 
代人第1个方程解出; c ,. 

我们的矩阵算法，即行化简算法的向后步骤，它求出简化阶梯形，与回代法所需算术运算 
次数相同_但矩阵算法通常减少了手算时出错的可能性.我强烈建议你仅使用简化阶梯形来解 
方程组！与本书配合的学习指导书给出一些好的建议帮助你更快更准确地解方程组. 


数值计算的注解 一般地，行化简算法的向前步骤比向后步骤需要更多运算.解方程 
组的算法通常用浮算来 衡量. 一个浮算 （ flop 或浮点运算）就是两个浮点实数进行一 
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次算术运算 （+，-，*,/) . G 对一个 „ x („ + i ) 矩阵，化简为阶梯形大约需要 
2 « 3 /3 + n 2 / 2 _ 7 n /6 次浮算（当”相当大，比如说” 彡30 时，大约是 2 n 3 /3 次浮算），而 
进一步化为简化阶梯形大约最多只需„ 2 次浮算. 

在 MATLAB 中，可用命令 flops 来计算某次计算中所需的实际浮算次数. 

存在与惟一性问题 


虽然非简化的阶梯形并不适于解线性方程组，这种形式对于回答 1 . 1 节中提出的两个基本 
问题已经足够了. 

例5确定下列线性方程组的解是否存在且惟一 

3^2 - 6^3+6^4 +4^5 =-5 
3^1 -7^ + 8 ^ -5^ +8^5= 9 
3 ^i - 9x 2 + 12^3 - 9^4 + 6^5 = 15 
解 该方程组的增广矩阵在例3中化简为 

—3 -9 12 -9 6 15 — 

0 2-4 4 2-6 ( g ) 

0 0 0 0 1 4 

基本变量是和自由变量是4和 々•这 里没有类似 0 = 1 的造成不相容方程组的方程，所 
以我们可用回代法 求解. 但解的存在性在方程 （ 8 ) 中已经清 楚了. 同时，解不是惟一的，因为 
有自由变量存在.而和々的每一种选择都确定一组解，所以此方程组有无穷多组解. ■ 

当一个方程组化为阶梯形，且不包含形如 0 = ft 的方程，其中 fc / o ， 每个方程包含一个基 
本变量，它的系数非零.或者这些基本变量已完全确定（此时无自由变量），或者至少有一个基 
本变量可用一个或多个自由变量表示，对前一种情形，有惟一 的解； 对后一种情形，有无穷多 
个解 （ 对应自由变量的每一个选择都有一个解）. 

上述讨论证明了以下定理 

定理 2 (存在与惟一性定理） 

线性方程组相容的充要条件是增广矩阵的最右列不是主 元列. 就是说，增广矩阵的阶梯形 
没有形如 


[0 0 b ] 

的行，若线性方程组相容，它的解集可能有两种情形： （ 丨 ） 当没有自由变量时，有惟一解； 
(ii ) 若至少有一个自由变量，有无穷多解 • ’ 

以下是求解线性方程组的 步骤. 


© 传统意义上，浮算仅表示一次乘法或除法，因为加法和减法需时很少，可以忽略，这里定义的浮算现在使用较多， 
这是由于计算机算术运算能力的提高.见 Golub and Van Loan , Matrix Computations 2nd ed (Baltimore: The Johns 
Hopkins Press, 1989), pp. 19-20. 
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应用行化简算法解线性方程组 

1. 写出方程组的增广矩阵. 

2 . 应用行化简算法把增广矩阵化为阶梯形_确定方程组是否有解，如果没有解则停止； 
否则进行下一步. 

3. 继续行化简算法得到它的简化阶梯形. 

4. 写出由第3步所得矩阵所对应的方程组 • 

5. 把第4步所得的每个方程改写为用自由变量表示基本变量的形式__ 


练习题 

1. 求出下列增广矩阵对应的方程组的解 

「1-3-5 0"! 
[0113」 

2. 求出下列方程组的通解 

Xi - lx 2 - x 3 -\-3x 4 =0 

— 2又1 + 4又2 + 5 jt 3 — 5又4 = 3 

3 ^：! - 6x 2 - 6x 3 + 8 x * = 2 


习题 1.2 

在习题1〜2中，确定哪些矩阵是简化阶梯形， 
哪些仅是阶梯形. 


1 

0 

0 

o' 


"1 

0 


o' 


0 


0 

0 

b. 

0 



0 


0 

0 


1 


0 

0 

0 

1 


'1 

0 

0 

0: 


•1 


0 


r 

0 



0 


0 

2 

0 

2 

2 

0 

0 

0 

0 

d 

0 

0 

0 

3 

3 

0 

0 

0 

1 


0 

0 

0 

0 

4 

"l 


0 

r 


1 


0 

(T 


0 

0 



b. 

0 



0 


0 

0 

0 

0_ 


0 

0 


1 


"1 

0 

0 

0" 


"0 



1 

l' 



0 

0 

d. 

0 

0 

2 

2 

2 

0 



0 


0 

0 

0 

0 

3 

0 

0 


1 


0 

0 

0 

0 

0 


行化简习题3〜4中的矩阵为简化阶梯形.在最 
终的矩阵和原始矩阵中圈出主元位置，指出主元列. 

_ 1 2 3 4] |"1 3 5 7" 

3- 4 5 6 7 4. 3 5 7 9 

6 7 8 9 5 7 9 1 


用行化简算法把习题5、习题6中的矩阵化为 
简化阶梯形，指出主元列. 

5. 给出一个非零 2x2 矩阵可能的阶梯形，用例1 
中的符号"，*和0表示. 

6. 对一个非零 3x2 矩阵，重复习题 5. 

在习题7~14中，给出线性方程组的增广矩阵， 


求其通解. 


9. 


11 . 


1 3 4 71 
3 9 7 6」 

0 1-6 5 "! 

1-2 7 -6J 

' 3 -4 2 0" 

-9 12 -6 0 
-6 8-4 0 

f 1 -7 0 6 



12 . 


0 


0 1-2-3 

7-427 


'1 -3 0-1 0 -2" 

0 10 0-4 1 

0 0 0 1 9 4 

0 0 0 0 0 0 



线性代数中的线性方程组 


21 


"1 2-5-6 0 -5' 
0 1-6-30 2 

0 0 0 0 10 
0 0 0 0 0 0 


习题15~16使用例1中阶梯形矩阵的符号给出 


线性方程组的增广矩阵，判断每个矩阵对应的方程 
组是否相容.如果方程组相容，判断解是否惟一. 


^■氺 氺氺^ 

15. a, 0 ■ * * 
0 0 ■ 0 
r- * *i 



16. a . 0 ■ * 
0 0 0 



在习题 17~18 中，确定 A 的值，使所给矩阵是 
一个相容方程组的增广矩阵. 



在习题19~20中，确定 A 和) t 的值，使方程组 


( a ) 无解， （ b ) 有惟一解， （ c ) 有多解，给出每种 
情况的答案. 


19. x,+hx 2 = 2 20. x , +3x 2 = 2 

4x, + 8x 2 = k 3jt, + hx 2 = k 

在习题 21~ 22 中，判断每个命题的真假，给出 
理由 . e 


21- a . 某些矩阵只要用不同的行运算次序就可行化 
简为不止一个简化阶梯形矩阵. 

b . 行化简算法只能用于线性方程组的增广矩阵. 

c . 线性方程组中的基本变量是系数矩阵中主 
元列对应的变量. 


d . 求线性方程组的解集的参数表示就是解这 
个方程组. 

e . 若某个增广矩阵的一行是 [0 00 5 0], 则对应 
的线性方程组是不相容的. 

22. a . 矩阵的阶梯形是惟一的. 

b . 矩阵的主元位置依赖于在行化简算法中是 
否使用行对换变换. 

c . 将一个矩阵化为阶梯形称为行化简算法的 
向前步骤. 


d . 当方程组具有自由变量时，解集一定包含许 
多解. 

e . 线性方程组的通解是所有解的一个显式表示. 

23. 设一个方程组的 3 x 5 系数矩阵有3个主元列， 

这个方程组是否相容，为什么？ 


24. 设一个线性方程组的 3 x 5 增广矩阵的第5列是 
主元列.该方程组是否相容，为什么？ 

25. 设一个线性方程组的系数矩阵每行有一个主 
元位置，说明为什么方程组是相容的. 

26. 设包含3个未知数的3个方程的系数矩阵每列 
有一个主元.说明为什么方程组有惟一解. 

27. 利用主元列的概念重述定理2的最后一句 :“若 
线性方程组是相容的，则解是惟一的当且仅 

28. 为了知道一个方程组是相容的且具有惟一解， 
你需要知道它的增广矩阵的主元列的什么情 
况？ 

29. 若线性方程组的方程个数少于未知数个数，它 
称为 欠定方程组. 设一个欠定方程组是相容 
的，说明它为什么会有无穷多解. 

30. 给出一个含有3个未知数和2个方程的不相容 
的欠定方程组的例子. 

31. 若线性方程组的方程个数多于未知数个数，它 
称为 超定方 程组.这样的方程组是否可能相 
容？用一个含2个未知数，3个方程的方程组 
说明你的答案. 

32. 设一个 ” x („ + l ) 矩阵用行化简算法化为简化 
阶梯形，当 ” = 30和 ” = 300时总的运算 （ 浮算） 
次数中，向后步骤占了多少比例？ 

设实验数据用平面上一些点表示.这些数据 

的一个 插值多 项式是其图像通过这些点的一个多 

项式.在科学工作中，这样的多项式可用来估计在 

已知数据之间的一些数值.另一个应用是在计算 


㊀判断命題的真假在许多章节中出现，论证的方法 
在 1.1 节习題23~24之前的说明中已经指出. 



22 


第 1 幸 


机屏幕绘制造图像.求这种插值多项式的一种方 
法是解线性方程组. 

33. 求数据 （1,12), (2,15), (3,16) 的插值多项 

式 P ( f ) = fl 。 + + fl 2 f 2 . 即求 使 

a 0 + fli ⑴ + a 2 (l) 2 = 12 
a 0 +ai(2)+a 2 (2) 2 =15 

flo + fl, ⑶ +a 2 (3> 2 =16 

34. [M】 在一次风洞实验中，空气对飞机的阻力在 

练习 题答案 

1. 增广矩阵的简化阶梯形和相应的方程组是 

1 0 -2 91 X , - 2 x ^=9 
0 1 13』 jc 2 + Jtj=3 

基本变量是 x ,^ x 2 , 通解为 （ 见图 1-6 ): 



图 1-6 方程组的通解是空间中两个平面相交的直线 

注意： 要点是一般解要描述每个变量，参数要明显标出.下面的写法是不正 确的： 
Xi =9+2 x 3 
x 2 = 3- x s 

x ,= 3 - x 2 不正确的解 
在这种写法中，似乎^和^都是自由变量，这当然是不对的. 

2. 当我们行化简方程组的增广矩阵，得 

' 1 -2-1 3 0] [1 -2 -1 3 0] [1 -2 -1 3 0' 

-2 4 5 -5 3 - 0 0 3 1 3 - 0 0 313 

3 -6 -6 8 2 ] [O 0 -3 -1 2_| |_0 0 0 0 5 


不同速度下为 

速度 (100 ft / sec ) 0 2 4 6 8 10 

空气阻力 (1001 b ) 0 2.90 14.8 39.6 74.3 119 
求这些数据的插值多项式，估计飞机速度为 
750 ft / sec 时的空气阻力用 

p ( t ) = Co + a t t + a ^ t 1 + a ^ f 1 + 4 + a 5 f 5 

若你用低于 5 次的多项式去计算.结果如何？ 
(例如，试用3次多项式 .） 0 


© 标有记号 [ M ] 的习题是设计为利用•‘矩阵程序”来求解的，例如 MATLAB 、 Maple . Mathematical MathCad . Derive 
或有矩阵计算功能的计算器.如*州仪器公司或惠普公司所制造的. 
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所得阶梯矩阵说明方程是不相容的，因它的最右列是主元列；第 3 行相应于方程 0=5, 因此不必 
再进行任何行变换.注意，自由变量在此问题中并不起作用，因为方程组是不相 容的. 


1.3 向量方程 


线性方程组的重要性质都可用向量概念与符号来描述.本节把通常的线性方程组与向量方 
程联系起来.名词“向量”出现在各种数学和物理教科书中，在第 4 章我们将讨论“向量空间”. 
在此以前，我们用向量表示一组数.这种简单的思想使得我们能够尽快地将它们应用于有趣和 
重要的问题. 

R 2 中的向置 


仅含一列的矩阵称为列向置，或简称向置，包含两个元素的向量如下所示. 


' 31 「0.2"| 「V 

I = , V = , W = 

-1」 [_0.3」 [ w 2 _ 


这里 W , 和 w 2 是任意实数.所有两个元素的向量的集记为 R 2 , R 表示向量中的元素是实数，而 
指数2表示每个向量包含两个元素 . 9 

R 2 中两个向量 相等， 当且仅当对应元素相等.因此，和是不相等的.我们称 R 2 中 
向量是实数的有序对. 

给定 R 2 中两个向量 u 和 v , 它们的和 u + v 是把对应元素相加所得向量.例如， 


剛 i;:K] 

I 乘法（或数乘）是把《的 

{_;]， c = 5 , 则…㈡七 


给定向量 U 和实数 n 与 C 的标置乘法 （ 或数乘）是把 U 的每个元素乘以 c ， 所得向量记为 
例如， 


中的数 C 称为标置（或数），它写成细体字母以区别于黑斜体的向量 n . 
向量加法与标量乘法也可以组合起来，如下例. 


例1给定 U = t 

—‘」和叶 

_5_|，求 4U ，（■ 

解 


H:] 

而 


4 m + (-3 )v = [ 


A 圖 


0 本书大部分内容讨论元素为实数的向量与矩阵.然而，第1~5聿的所有定义和定理，以及本书其他部分的大部分内 
容.对元素是复数时也成立，复向量与矩阵应用于在电气工程和物理中. 



24 


第 1 章 


有时为 r 方便 （ 以及节省篇幅），我们把列囱量写成（3, -1) 的形式.这时，我们用 

圆括弧表示向 S ， 并在两个元素之间加上逗号，以便区 别向量 （3,-1) 与 1 X 2 行矩阵 [3 -1], 
后者使用方括号且两元素之间无逗号. 

于是 O _ 1] 

因为这两个矩阵的维度不同，尽管它们有相同的元素. 

R 2 的几何表示 

考虑平面上的直角坐标系.因平面上每个点由实数的有序对确定，我们可把几何点与 
列向等同.所以我们可把 R 2 看作平面上所有点的集合，见图 1-7. 

向量的几何表示是一条由原点 （0,0) 指向点 （3,-1) 的有向线段（用箭头画出），见 
图 1-8. 



图 1-7 用点表示的向奮 图 1-8 用箭头表示向量 

在这种情况下，单个的在箭头方向上的点本身并不重要. 

向量的和也有很有用的几何 意义. 下列规则可用解析几何的知识证明. 

向置加法的平行四边形法则 

若 R 2 中向量 u 和 v 用平面上的点表示，则 u + v 对 应于以 II , 0和 v 为三个顶点的平行四 
边形的第 4 个顶点，见图 1-9. 



© 在物理中. "箭 头"可表示力.通常可在空间 中自由 移动， 向量的 这种解释将在 4.1 节讨论. 




线性代数中的线性方程组 


25 



例3设在图上表示向量 《,2 k 和- in . 

解见图1-11，其中表示出向量 《， 2K = f 幻和 - 20 表示的箭头长度是**表 

示的箭头长度的 2 倍，指向相同的方向，表示的箭头长度是《表示的箭头长度的 2/3 倍且 
指向相反的方向.一 般地， C B 表示的箭头长度是 b 表示的箭头长度的 I cl 倍.[回忆由 （0,0) 到 
(a,b) 的线段长度为 47^ , 我们将在第6章做进一步的讨论 .] 



R 3 中的向置 

K 3 中的向量是 3x1 列矩阵，有 3 个元素.它们表示 3 维坐标空间中的点，或起点为原点的 
箭头，图 1-12 表示向量 a = |V| 与 2 a . 



图 1-12 R 3 中向量的标量乘法 



R " 中的向量 


若 n 是正整数， R " 表示所有《个实数数列（或有序 n 元组）的集合，通常写成 nxl 列矩阵 
的形式，如 


所有元素都是零的向量称为零向量，用0表示 （ 0中元素的个数可由上下文确定）. 

K " 中向量相等，向量加法与标量乘法运算类似于 R 2 中的定义.向量运算有下列性质，它 
们可直接由实数的相应性质证明.见本节末的练习题1与习题33和 34. 

I K ” 中向量的代数性质 I 


对『中一切向量以及标量 C 和 d ， 


( 11 ) (tt + V) + W =tt + (V + w) 
( iii ) K+o = o+tt = k 


(V ) c { u + v ) = cu+cv 
(vi ) ( c + d ) u=cu + du 
(\1 i ) c ( du ) = ( cd )( u ) 


(iv ) u + (-«) = -«+ ii = o ( viii ) \ u=u 

其中一 《 表示(一 i ) i <. 


为了简单起见，我们也使用“向量减法”，用 II - V 代替 ll + (_ l ) v , 图 M 3 说明 K - V 是 1 <和. 




给定 R ” 中向量”，，〜…，心和标量〜匕…冬，向量 
y = c , v ,+—+ c p v p 

称为向量 VbVy . V , 以 c ,， c 2 , …, c p 为权的线性 组合. 上述性质 ( ii ) 使我们在计算这样的线性组合 
时不必加上 括号. 线性组合中的权可为任意实数，包 括零. 例如，下列向量都是 v ,* v 2 的线性组合： 
Sv,+v 2 , ^V|f=^v,+Ov 2 l , 0(=0vi+0v 2 ) 
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例4图 1-14 选择性给出向量 v, 和 v 2 =|^j 的某些线性组合 .（ 注： 图中平行网格线 

是通过 v, 和 v 2 的整数倍画出的 .） 估计由 v, 和 v 2 的线性组合生成的向量《和 w . 



解平行四边形法则说明《是如,与-2» 2 的和，即 
« = 3v, - 2v 2 

这个《的表达式可以解释为经过两条直线路径从原点到达《的移动指令.首先在 v, 方向移到3 
个单元到达 3v,, 然后在 v 2 方向（平行于经过》> 2 和0的直线）移动 -2 个单元.虽然向量 w 不在 
网格线上，它在两条线的正中间，在由 （5/2)v, 和(-1/2)»> 2 所确定的平行四边形的顶点处（见图 
1-15), 因此 

5 1 

w =-v, —— v 2 
2 2 



下面的例子把线性组合与 1.1 节、 1.2 节的存在性问题联系起来. 


例5 



1' 


•i 


" 7" 

设 a 1 = 

_2 

, a 2 = 

5 

， b = 

4 




6 


-3 


,确定6能否写成化和化的线性组合，也就是说, 


确定是否存在权 JC, 和&使 


若向量方程 （ 1 ) 有解，求它的解. 


jc,a, +jc 2 a 2 =b 
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解 根据向量加法和标量乘法的定义把向量方程 


r 


'2* 


' 1 

-2 

+义2 

5 

= 

4 

-5 


6 


-3 


写成 

或 




2x 2 


' 1 


+ 

5 x 2 

= 

4 

_-5々 


6x 2 


_-3_ 


JC ! + 2 x 2 
- 2 xi + 5 x 2 

—5 jci +6义2 


4 

-3 


( 2 ) 


(2) 式左右两边的向量相等当且仅当它们的对应元素相等.即;^和七满足向量方程（1)，当且 
仅当; c , 和; c 2 满足方程组 


JC ! + 2 jc 2 = 7 

~ 2 x l + 5 x 2 = 4 (3) 

~ 5 xi + 6x2 — —3 


我们用行化简算法将上述线性方程组的增广矩阵化简，以此解方程组 0 : 


'12 7' 

-2 5 4 j 


•1 2 1 

0 9 18 

~i 

"1 2 1 

0 1 2 


_ 1 0 3" 

0 1 2 

-5 6-3」 


0 16 32 


0 16 32」 


0 0 0 


( 3 ) 的解是々 =3， jc 2 =2，因此 A 是屮与叱的线性组合，权为;^=3和 jc 2 =2, 即 


r 


'2 


'i 

-2 

+ 2 

5 

= 

4 

-5 


6 


-3 


注意例5中原来的向量叫，和6是我们进行行化简的增广矩阵的列 


1 2 1 
-2 5 4 

-5 6-3 


让我们将此矩阵写成另一形式，使它的列备受关注，即 

[<Ji a 2 A ] (4) 

这样，由向量方程 （ 1 )可以直接写出增广矩阵而不必经过例5中的中间步骤.就是按它们在 （ 1 ) 
中出现的次序排列，就得到矩阵 （4). 


0记号表示矩阵行等价（见 1.2 节）. 
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由上述讨论我们可以得到以下结论- 
~向 量方程~ 

x,a, +x 2 a 2 + ■■■ + x„a„ =b 

和增广矩阵为 

[oi 02 ••• a„ b\ ( 5 ) 

的线性方程组有相同的解集.特别地， ft 可表示为 a ,,%,--. 的线性组合.当且仅当对应于 （5) 
式的方程组有解. 


线性代数的一个主要思想是研究可以表示为某一固定向童集合{ V , ， Vf . V p } 的线性组合的 
所有向量. 

定义 若…, V, 是『中的 向量， 则 V|,V2，-.,Vp 的所有线性组合所成的集合用记号 
Spanlv^va, …, Vp} 表示，称为由 …， v, 所生成 （或 张成）的 R" 的 子集， 也就是说， 
SpanlVi . vv . Vp } 是所有形如 

C|V|+C 2 V 2 + •• + C p Vp 

的向量的集合，其中 c ,， c 2 ，…, C , 为标量. 

要判断向量&是否属于 Spanlv ,，^ ，…， V ,}，就是判断向量方程 
jciVi +x 2 v 2 + •••+j ： pV l , =b 

是否有解，或等价地，判断增广矩阵为 [ V | V 2 〜 V P 幻的线性方程组是否有解. 

注意 Span{v,,v 2 ，…, V ,}包含 V ,的所有倍数，因 cv, =cv,+0 v 2 +—+0»^ ,特别地，它一定包含 
零向 M . 

Span{v} 与 Span{«,v} 的几何解释 

设 v 是 IR 3 中的向量，那么 Span{v} 就是 v 的所有数量倍数的集合，也就是通过 v 和0的直线 
上的所有点的集合，见图 1-16. 

若 u 和 V 是 R 3 中的非零向量， IT 不是 B 的倍数，则 Span {«， W 是 R 3 中通过 II , v 和0的平面， 
特别地， Span |«, W 包含 R 3 中通过《与0的直线，也包含通过 v 与0的直线（见图 1-17 ). 
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例6设= 

r 

-2 

， a 2 = 

~ 5 

-13 

, b = 

-3" 

8 


3 


-3 


1 


，则 Span { fl ,, fl 2 } 是 R 3 中通过原点的一个平面， 


问办是否在该平面内？ 

解方程 JC , fl ,+； C 2 fl 2 = ft 是否有解？为回答此问题，把增广矩阵 [ fl , 冽进行 行化简 


1 5 -3" 


"1 5 -3' 


■1 5 -3" 

-2 -13 8 

- 

0-3 2 

- 

0-3 2 

■ 3-31」 


0 -18 10 


0 0-2 


第3个方程为 0; c 2 =-2，它说明方程组无解，向量方程; c , fl , + x 2 a 2 = ft 无解，故办不属于 Span { fll ， fl2 }. ■ 


应用中的线性组合 

本节最后一个例子说明标量乘法与线性组合在某一个量，例如“成本' 被分解成若干部分时的 
一个应用.这个例子的基本原理是，生产某种产品的单位成本已知时，可求出生产若干个单位的成本. 
{单位数量 } x { 每单位成本 }={ 总成本 } 

例7某公司生产两种产品，每美元价值的产品 fi ，公司需耗费 0.45 美元材料， 0.25 美元 
劳动， 0.15 美元管理费用，对每美元价值的产品 C ,公司耗费 0.40 美元材料， 0.30 美元劳动， 0.15 
美元管理费用，设 



"0.45' 


'0.40' 

b = 

0.25 

c - 

0.30 


0.15 


0.15 

则办和(:称为两种产品的“单位美元产出成本’ 




a . 向量 100& 的经济解释是什么？ 


b . 设公司希望生产 々美元 产品和;美元产品 C . 给出描述该公司花费的各部分成本 
(材料，劳动，管理费用）的向量. 

解 a . 我们有 



"0.45~ 


'45' 

100 ft = 100 

0.25 

= 

25 


0.15」 


15 


向量 100 ft 列出生产100美元的产品需要的各种成本，即45美元材料、25美元劳动、15美元 
管理费用. 

b. 生产々美元的产品的成本由向量;给出，生产; c 2 美元的产品 C 的成本由向量^给 
出.因此总的成 本为; + . ■ 

练习题 

1. 对 R " 中的任意向量《与 v ， 证明 《 + v = v +«. 

2. / i 取什么值时，向量 >属于 Spanfv ^ ViA }， 若 



1 


' 5" 


二 3. 


'-4' 

= 

-1 

， v 2 = 

-4 

， v 3 = 

1 

，夕 = 

3 


-2 


- 7 」 


0 


h 
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习题 1.3 


在习题1和2中，计算 《 + v 与 《-2v. 

L u O 七 ] 

2 - “.’ v i 3 

在习题3和4中，用箭头在分平面上表示下 
列向量： 《，v,-v，-2v,« + v，《-v，《-2v ，注意 《-v 是 
三个顶点为《，0和 -V 的平行四边形的另一个顶点. 



3. «与“如习题 1. 

4. «与v如习题 2. 

在习题5和6中，写出等价于所给向量方程的 
线性方程组. 


■6] 

—1 + 

_ 5_| 

"-3" 

4 = 

0 

1 

= -7 

-5 

"-21 



利用附带的图把习题7和8中的向量用 《*v 
的线性组合表示. R 2 中的任意向量是否一定是向 
量《和〃的线性组合？ 

7. 向量 8. 向量 m >， jc ， 夕， z 

在习题9和10中写出等价于给出的方程组的 



r 


0 


' 5' 


' 2 

11. fl! = 

-2 

, a 2 — 

1 

， = 

-6 

，*= 

-1 


0 


2 


8 


6 



r 


■0, 


2 


.-5 - 

12. a,= 

-2 

, a 2 = 

5 

， <h: 

0 

， = 

11 


2 


5_ 


8 


-7 


在习题13和14中，确定6是否矩阵 A 的各列 


向量的线性组合. 



1 -4 2" 


' 3' 

13. A = 

0 3 5 

-2 8-4 

，b = 

-7 

-3 



■1-2 

-6. 


'll' 

14. A = 

0 3 

7 

，b = 

-5 


1 -2 

5_ 


9 


在习题15和16中，写出属于 Spanfvnv,} 中的 
5个向量以及用来生成这些向量的的权，并写 
出这些向量的3个元素.不用画图. 



-5' 

3 

0 


-21 



0 


17. 设 fl, = 



■-2" 

| 

•4_ 

, a 2 = 

-3 

，叫 

1 


• 1_ 


h 


,当/!取何值 


时 ft 是在 fl, 和 fl 2 生成的平面内？ 


18. 


设 v,= 

r 

0 

,v 2 = 

1 

，广 

'h 

-5 


-2_ 


8 


-3_ 


，当取任何 


值时_y在v,和 〃 2 生成的平面内？ 

19. 对下面的向量，给出 SpaiUw,} 的几何解释. 


向量 方程： 

9. jc 2 +5jc 3 =0 10. 4xi + jc 2 +3jc 3 = 9 

4xi + 6;c 2 - ;c 3 = 0 Xi - lx 2 -2 x 3 = 2 

-Xi + 3x 2 -Sx 3 =0 8a+6jc 2 -5jc 3 =15 

在习题 11 和 12 中，确定 ft 是否的线 
性组合. 



' 8' 


'12* 

Vi = 

2 

,v 2 = 

3 


-6 


-9 


20. 对习题16中的向量，给出 SpanfvMiM 的几何 
解释. 
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21 ■设 




证明： 对所有 /! 和 ； t 


'h 

’1a 


属于 Span {«， v }. 

22. 构造一 3 x 3 无零元素的矩阵 4 和一 R 3 中的向 
量使得6不属于4的列向量的生成集. 
在习题23和24中，判断下列命题的真假，给 

出理由. 

23 . a . 向量 ㈡ 的另一个写法是 [-4 3]. 

{>[1] 的两 


点位于通过 


b . 平面上对应于 
原点的一条直线上. 

c . 向量是向量〃,和〃 2 的线性组合. 

d . 增广矩阵为 [ a , fl2 fl3 幻的线性方程组的解 


集与向量方程 x , a , + X 2 a 2 + Xsa 3 = b 的解集相 
同. 

e . 集 Span {«， v } 总是表示通过原点的一个平面. 
24. a . 任意5个实数组成的数列是 R 5 中一个向量. 

b . 向量 u 等于向量 u-v 与向量 v 之和. 

c . 在线性组合 qv ,+ c 2 v 2 +… + CP 中，权 
C |, c 2 , …心不能全为 0. 

d . 当 II 和 v 是非零向量时， Span {«， v } 包含通 
过《与原点的直线. 

e . 对应增广矩阵 [ fl , 的线性方程组 


是否有解的问题等价于6是否属于 
Span { a ,, a 2 , a 3 } 的问题. 


"10-4" 
25.设4= 0 3-2 

-2 6 3 



以表示 


4的各列.并设 W = Span { fl ,， fl2 , fl3 }. 

a . 办是否属于 { a ,， fl 2 , fl 3 } ?在 { fl ,, fl 2 ， fl 3 } 中 
有多少个向量？ 


b . A 是否属于 W ?, W 中有多少个向量？ 


c . 证明： fl , 属于 W (提 示： 不必作行变换）. 



" 2 0 6' 


"10" 

26. 设4 = 

-18 5 

， b = 

3 


1-2 1 


3 


,设 W 为4的列 


向量的所有线性组合的集合. 

a . A 是否属于 W ? 

b . 证明： 4的第3列属于 

27. 某矿业公司有两个矿，#1矿每天生产20吨铜 
和550公斤银，#2矿每天生产30吨铜和500 

公斤银，设”口冗]， — 

分别表示#1矿与#2矿的“日产出”. 

a . 向量 5 v , 有什么实际意义？ 

b . 设该公司的#1矿生产; c , 天，#2矿生产&天， 
写出表示该公司生产150吨铜与2 825公斤 
银时，各矿生产天数的向量方程，不必解方 
程. 

c . [ M ] 解 （ b ) 中的方程. 

28. 某蒸汽厂烧两 种煤： 无烟煤 （A ) 和烟煤 （B ), 
每吨煤 A 燃烧产生 27.6 百万焦耳的热量,3 100 
克二氧化硫和250克固体粒子污染物.每吨煤 
B 燃烧产生 30.2 百万焦耳的热量，6 400克二 
氧化硫和360克固体粒子污染物. 

a . 若该厂燃烧 jc , 吨煤 A 和; c 2 吨煤 B ， 它产出 
多少热量？ 

b . 设该厂的产出可用它产出的热量，二氧化硫 
和固体粒子污染物的量构成的向量表示. 
把这个产出用两个向量的线性组合表示，设 
它燃烧煤 Ajc , 吨和煤 Bjc 2 吨. 

c . [ M ] 设某一段时间，该厂生产162百万焦耳 
的热量，23 610克二氧化硫和1 623克固体 
粒子污染物，写出向量方程，并确定该厂 
烧了两种煤各多少吨？ 

29. 设 v ,， v 2 是 R 3 的点，且对 j = l ，2 ，...,；t 在 
点匕有 质量为 m , •的物体.物理学家称这些物 
体为质点.这个质点系的总质量为 

m = mi + m 2 + …+ m k 
质点系的重心（或质心）是 

v = —(miV! +m 2 v 2 + '-- + m k v k ) 
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计算由下列质点组成的质点系的重心（见下 


图)： _ 

点 _ 质量 

»,=(5. -4,3) 2克 

»2=(4.3, -2) 5克 

»3 = (-4, -3 , -1) 2克 

»4=(-9,8, 6) 1 克 



30. 设 v 为习题29中的一组质点的质心， 
v 是否属于 Span {»>,, -•,»>»}? 给出理由. 

31. 一块密度和厚度均匀的三角形薄板，其三个顶 
点分别是 v , = (0,1), v 2 =(8.1 Xv , = (2.4), 如下图 
所示，且其质量为3克. 

X2 

4 


a . 求这块薄板的质心坐标 U ,>0. 这块薄板的 
“平衡点”与在三个顶点上有1克质量的薄 
板的质心相重合. 

b . 求如何在三个顶点上分布额外的6克物质， 
使得薄板的平衡点定位在点 （2,2) 上.（提 
示：设 w ,, w 2 ，> v 3 分别表示加在三个顶点上的 
质量， 则叫 + w 2 + w 3 =6.) 

32. 考虑在中的向量 v , , v 2 , v 3 和 ft ,如下图所 
示，方程 JW + JC 2 V 2 + Jt 3 V 3 =办是否有解？解是 
否惟一？使用图形给出解释. 


V 



33. 设《 = («|,«2,…， 《«) .* , = (v„v 2l —,v„) ,w = (w„ 
W2 ,-, W a ), 证明 R" 的下列代数 性质： 

a. (ii+v)+w = i#+(v + w). 

b. c(ii + v) = c« + cv, 其中 c 为任意数 . 

34. = 证明 R” 的下列代数 性质： 

a. u + (-») = (-«)+ii = 0. 

b. c (也 ) = («/)«, 其中 C ， € / 为任意数 • 


练习题答案 

1. 取 R ” 中任意向量 11 = ( 11 ,, «2, * •,«»), v =( v „ v 2 , -, v (I ) , 

ll + V = (ll| +Vi, w 2 + v 2 , …， u H + v m ) 向量加法的定义 
= ( vi + wi , v 2 +W2,—*v II + w ll ) IR 中加法交换律 

= V + I / 向量加法的定义 

2. 向量少属于 Span { v ,， v 2 , v 3 }, 当且仅当存在 数為， 义 2 , x 3 使 


一 1 

+ X 2 

• 5 

+ X 3 

-3* 

1 

二 

-4' 

3 

-2 


-7 


0 


h 


该向童方程等价于含3个未知数的3个方程组成的方程组.化简这个方程组的增广矩阵，得 
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' 1 5 -3 - 4 " 


15 - 3 - 4 ' 


15 - 3 - 4 ' 

- 1-4 13 

- 

0 1 - 2-1 


0 1 - 2-1 

- 2—7 0 h 


0 3-6 h-S 


0 0 0 — 5 


当且仅当第4列没有主元时，方程组是相容的，也就是说， A-5 必须为0,因此当且仅当 A = 5时 ，少属 
于 Span{v,, v 2 , v 3 }. 见图 1-18. 

记住： 方程组中有自由变量并不能保证方程组有解. 



线性代数中的一个基本思想是把向量的线性组合看作矩阵与向量的积.下列定义允许我们 
将 1.3 节的某些概念用新的方法表述出来. 

定义 若 A 是 mx/j 矩阵，它的各列为 an,. 若 jc 是 IT 中向量 ，则 A 与 jc 的积 ，记为 Ac, 
就是 A 的各列以 jc 中对应元索为权的线性组合，即 

Ar = [a, a 2 a „] ， = 灿 + 祕 2 十…+文此 


注意 At 仅当 A 的列数等于 jr 中元素个数时才有定义. 
例1 



2-3 

厂 4 l 

「2] 


-3’ 


「 8 1 


-2 r 


-131 

b . 

8 0 

□= 4 

8 

+ 7 

0 

= 

32 

+ 

0 

= 

32 


- 5 2 

L’J 

-5 


2 


[-20」 


14 


- 6 


例2对 R " 中把线性组合 3 r ,-5 v 2 +7 r 3 表示为矩阵乘向量的形式. 
解把 h , v 2 ， v 3 排列成矩阵 A ■ 把数3, -5, 7排列成向量 jc ， 即 

r 内 1 


3r,-5r 2 + 7r 3 =[r, v 2 r 3 ] 


-5 


=Ax 


■ 
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在 1.3 节中我们学习了将线性方程组写成包含向量线性组合形式的向量方程，例如，方程组 
A + 2:2 - : 3 = 4 ( 1 ) 

-5^2 + 3jc 3 = 1 

等价于 

欄 (2) 

如例2所示，我们也可将方程左边的线性组合写成矩阵乘向量的形式， （2) 成为 


0-5 


(3) 


方程 （3) 有形式 Ar =6 ，我们称这样的方程为矩阵方程，以区别于 （2) 式那样的向量方程. 
注意 （ 3) 中的矩阵仅是方程 （ 1 ) 中的系数矩阵，类似的计算说明，任何线性方程组，或 
类似于 （ 2) 式的向量方程，可以写成等价的形式为丸的矩阵方程，这一简单的观点将在 
本书中重复使用. 

下面是正式的结果. 

定理 3 若 A 是 wx « 矩阵，它的各列为 fll ，…, fl „， 而 ft 属于 IT , 则矩阵方程 

Ax=b ( 4 ) 

与向量方程 

x l a l + x 2 a 2 +--- + x „ a „ = b (5) 

有相同的解集.它又与增广矩阵为 

[fli a 2 … a „ b ] ( 6 ) 

的线性方程组有相同的解集. 


定理3给出了研究线性代数问题的一个有力工具，使我们现在可将线性方程组用三种不同 
但彼此等价的观点来 研究： 作为矩阵方程、作为向量方程或作为线性方程组，当我们构造实际 
生活中某个问题的数学模型时，我们可自由地选择任何一种最自然的观点.于是我们可在方便 
的时候由一种观点转向另一种观点.任何情况下，矩阵方程、向量方程以及线性方程组都用相 
同方法来解——即用行化简算法来化简增广矩阵 （6) • 其他解法将在以后讨论. 

解的存在性 


Ar 的定义直接导致下列有用的事实. 


方程 Ar =» 有解当且仅当 ft 是 A 的各列的线性组合. 


在 1.3 节中，我们考虑了存在性问题’ “ ft 是否属于 Span { fl ,, …， fl „}? ，’等价地，是 
否相容？” 一个更困难的问题是要确定方程丸对任意的 ft 是否有解. 


例3设4 = 

1 

-4 

3 4" 

2-6 

， b = 

b ,' 

b 2 


—3 

-2-7」 


b . 


_方程 Ar =6是否对一切可能的心&為有解？ 
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解 把 Ac = A 的增广矩阵行化简， 

1 3 4 fc,] [1 3 4 fei ] 1 3 4 b , 

-A 2 -6 *2 ~ 0 14 10 b 2 +4 bt ~ 0 14 10 * 2 +4fc, 

-3-2-7 L ° 7 5 ^ +3b >\ 0 0 0 b .+^-^ b .+ Ah ) 

增广列的第 3 个元素为方程 Ac = A 并不是对一切的 A 都有解，因可能 

不为零. ■ 

例 3 中的简化矩阵描述了使 A « r=A 有解的所有 A 的 集合； 6 必须满足 

bt-^b 2 +bi =0 

这是 R 3 中一个通过原点的平面，这个平面就是 A 的 3 列的所有线性组合的集合，见图 1-19. 



图 1-19 A=[a, a, fl 3 ] 的各列生成通过原点的平面 

例 3 中的方程 At = A 并非对所有的 A 都相容，这是因为 A 的阶梯形含有零行.假如 A 在所 
有三行都有主元，我们就不必注意增广列的计算，因为这时增广矩阵的阶梯形状不可能产生如 
[0 0 0 1] 的行. 

在下一定理中，当我们说 A 的列生成 R" 时，意思是说 R" 中的每个向量6都是 A 的列的线 
性组合 .一 般地， R" ■中向量集 {v,， …， vj 生成 IT, 意思是说， R m 中的每个向量都是 v,，...,v p W 
线性组合，即 Span{v,， … ,v p } = R". 

定理4设 A 是 wx/j 矩阵，则下列命题是逻辑上等价的，也就是说，对某个 A， 它们都成 
立或者都不成立. 

a. 对 R m 中每个 6， 方程 Ac=A 有解. 

b. R" 中的每个6都是 A 的列的一个线性组合. 

c. A 的各列生成 IT. 

d. A 在每一行都有一个主元位置. 
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定理4是本章中最有用的定理之一.命题 （ a )、（ b ) 和 （ c ) 等价是 根据处 的定义和一组 
向量生成 IT 空 间的含意而得 到的. 再根据例3后面的讨论得到命题 （ a ) 和 （ d ) 等价.定理完 
整的证明在本节末尾中给出.在习题中给出应用定理4的例子. 

警告定理4讨论的是系数矩阵，而非增广矩阵，若增广矩阵 [A 幻在每一行都有主 
元位置，方程 / Ur =6 可能相容，也可能不相容. 


如的计算 

例1中的计算是根据矩阵>1与向量 X 的乘积的定义.下面的例子给出手工计算的元素的一 
种更有效的方法. 

" 2 3 4" 

例4计算如，其中>1= - 1 5-3 

6-2 8 

解 由定义 " 


" 2 3 4" 



' 2 



3' 



. 4 


-1 5-3 

x 2 

=Xi 

—1 

+ 义 2 

5 

+ 义 3 

-3 


6-2 8 



6 



-2 



8 





「 2V 


[ 

3 x 2 



4 x 3 ' 


2 xj +3^2 +4^3 



= 


- Xx 

+ 


5 x 2 

+ 

-3^ 

= 

- x x +5 义 2 -3^3 






r 2x ^ - 



8 义 3 


6 x x - 2 x 2 +8^3 _ 


矩阵如的第一个元素是>1的第一行与 JC 中相应元素乘积之和 （ 有时称为点积），即 
2 3 4 x x 2 x x +3^2 +4^3 
x 2 = 

_ 」 Ud L _ 

此矩阵说明，如何直接计算如中的第一个元素，而不必像 （7) 中那样写出所有运算步骤.类 
似地，如中的第二个元素可以直接把 A 的第二行各元素与 JC 中对应元素相乘再求和 得出： 

' ""^1" ' 

一1 5-3 x 2 - - X \ +5 x 2 -3^3 

_ 」 U 3 」L 

类似地，心:中第 3 个元素可由 A 的第 3 行与 x 的元素算出. ■ 

计算心：的行——向量规则 — 

若乘积 Ac 有定义，则 Ac 中的第/个元素是 A 的第 i •行元素与 X 的相应元素乘积之和. 



例5 



1-4 + 2-3 + (-1)-7]_["3" 
■0.4 + (-5)-3 + 3.7」 = l_6- 
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_ 2 -3’ 

厂 / i 1 


"2-4 + (-3)-7' 


b . 

8 0 


= 

8.4 + 0.7 

= 


-5 2_ 

L 7 」 


(-5)4 + 2.7 



： 1 0 0' 


r 


1 - r +0-5 +0? 

C. 

0 0 


s 


Or + l-5 + O? 


0 0 1 


t 


0- r + 0- 5 + 1 



例 5( c ) 中的矩阵，主对角线上元素为1,其他位置上元素为0,这个矩阵称为单位 矩阵， 
并记为 /. ( c ) 中的计算说明，对任意 R 3 中的 X ， Ix = x . 类似地，有 nxn 单位矩阵，有时记 
为/„,如 U ) 中所示，对任意 R " 中的 X ， I n x = x . 

矩阵- 向置积 ^的性质 

下面定理中的事实是重要的，在本书里经常使用，它们的证明依赖于如的定义及 R ” 的代 
数性质. 

定理5若 A 是 mXAi 矩阵， u 和 v 是 R " 中向量， c 是标量，则 

a . A (« + v ) = Au + Av . 

b . A(cu) = c{Au). 

证为简单起见，取 n = 3, A = [ a , a 2 a 3 ], H，v 为 R 3 中的向量（一般情况的证明类似），对 
*' = 1,2,3 ,设和 v , 分别为 h 和 v 的第 i •个 元素. 为证明 U ), 把 A(h + v ) 作为>1的各列的以 H + V 
的元素为权的线性组合来计算. 

+ V1 


A («+ v ) = [ a , a 2 a 3 ] 


u 2 + v 2 
w 3 +v 3 


：+ v 2 ) a 2 +( w 3+ v 3) a 3 


' i + y 的元素 
- 的各列 


=(Wifli +W2<*2 +“3fl3) + (Vifl| + V2<*2 + V3<*3) 

=Au + Av 

为证明 （ b ), 把 A ( C «) 作为 A 的各列以 a /的 各元素作为权的线性组合来计算. 


A(c«)=[a, a 2 a 3 ] 


: ( CW !^! + ( cu 2 ) a 2 + ( cu 3 ) a 3 


= c(wifli) + c(w 2 a 2 ) + c(w 3 a 3 ) 

= C { U \ Q X + M 2 fl 2 + w 3 a 3 ) 

= c(Au) 

数值计算的注解 为使计算 如 的计算机算法最 优化，一 系列的计算对存储在相连的 
存储单元中的数据 进行. 矩阵计算中最广泛运用的算法是用 Fortran 语言写成的，它把 
矩阵作为若干列来存储，这样的算法把如作为>1的列的线性组合来计算.对比而言， 
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若程序用通用的 C 语言来写，它把矩阵按行存储，如就必须用另一种规则计算，这 

种算法使用>1的行. 

定理4的证明如定理4后面所指出的，命题 （ a ), ( b ) 和 （ c ) 逻辑上等价，因此，这里 
只需证明（对任意矩阵4 ) 命题 （ a ) 和 （ d ) 同时为真，或同时为假，就可以建立四个命题的 
等价性. 

设(/为4的阶梯形. 给定] fT 中的我们可把增广矩阵 [ A 紀行化 简为增广矩阵 [(/ rf ]， 
这里是] fT 中的某个向量. 

[A b] - W d] 

若 （ d ) 成立， （/ 的每一行包含一个主元位置而在增广列中不可能有主元.故对任意 A , 
有解，故 （ a ) 成立.若 （ d ) 不成立， U 的最后一行都是0,设 rf 是最后一个元素为1 
的向量，于是取 rf ] 代表一个不相容的方程组，因行变换是可逆的， [(/ </] 可变换为形如 [A A ] 
的矩阵，所得方程组也是不相容的，故 （ a ) 也不成立. ■ 

练习题 


1 5-2 O' 


' 3' 

-2 


'-i 

-3 1 9-5 

， P = 

， b = 

9 

4-8-1 7 


U 

-4 


0 


设/1 = 


为 A 的列的线性组合. 


，可以证明 p 是处=6的一个解.应用这个事实把6表示 


「2 5] r 4l r_ 3 "i 

2.设 A = , ，， u = , , v = ^ , 计算 A(k + v ) 和 Ak + Av 来验证定理 

j 1J L 一】」 5 


习题 1.4 


计算习题1~4中的乘积， （ a ) 像例1那样使用 
定义， （ b ) 使用计 算处的 行向量规则.若某一个 
乘积没有定义，加以说明. 



在习题 5~8 中，使用 Ac 的定义把矩阵方程写 
成向量方程，或反过来. 


5. 




- 8 ' 

16 


-2 


6 . 


■7-3. 


r 

2 1 

[_ 2 ]_ 

-9 

9-6 


12 

厂 3 2 


-4 



在习题9~10中，将方程组写成向量方程和矩 


阵方程. 

9. 3 Ar , + Ar 2 -5 Ar 3 =9 10. 8^,- x 2 =4 

x 2 + 4at 3 = 0 5^,+ 4* 2 =1 

x , - 3at 2 =2 
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在习题11~12中.给定 A 和 ft , 写出对应矩阵方 
稈 Ax =6的增广矩阵并求解.将解表示成向童形式. 
12 4] 「-2 - 

11. A = 0 1 5 ， b = 2 

-2 -4 -3j [ 9 

1 2 1 ' 

12. A = -3 -1 2 ,b = 

0 5 3. 

「 0 1 r 3 - 5 ' 

13 •设 11 = 4 , A = -2 6 , 11 是否在由 A 的列 

.4」 [ 1 l . 

所生成的 JR 3 的子集中？ （ 见图 1-20. )为什么？ 




' 21 p 

8 

1 

14. 设《= -3 , A = 0 

1 

-1 • w 是否在由 A 的 

2 j [l 

3 

0 

列所生成的 R 3 的子集中？为什么？ 

15•设 A = ^ ) ，办 = 

k 

，证明方程 Ac =6不是 

-6 3 

p 2 



对一切6都相容，并说明使 A * = 6相容的所有 
向量 A 的集合. 

. 1 -3 叫 [V 

16. 又设 A = -3 2 6， *= ，重复 15题. 

.5-1-8」 

习题17~20用到下面的矩阵 A 和艮给出回答 


以及用到的定理. 



17. A 中有多少行包含主元 位置？ 方程是否 


对 R 4 中的每个£>都有解？ 


18. 的列是否可以生成 R 4 ? 方程份 =_ y 是否对 
R 4 中的每个^都有解？ 

19. 议^中的每个向量都可以写成矩阵 A 的列的线 
性组合吗？ A 的列是否可以生成 1 T ? 

20 . R 4 中的每个向量都可以写成矩阵 B 的列的线 
性组合吗？ fl 的列是否可以生成 R 3 ? 



' 0] 0] r 4 

22. 设 0 ,Vi= -3 ,v 3 = -1 .{Vhhv]} 是 

-2j 8J L -5 . 

否生成 R 3 ? 

习题 23~24 中，判断各命题的真假，给出理由. 

23. a. 方程 Ac =办称为向量方程. 

b. 向量6是矩阵 A 的列的线性组合，当且仅当 
方程 Ac = ft 至少有一个解. 

c. 方程相容，当且仅当增广矩阵 [A ft] 
的每一行有一个主元位置. 

d. 乘积 Ac 的第一个元素是乘积的和. 

e. 若 mxn 矩阵 A 的列生成 R”， 则对 R" 中任 
意的 ft, 方程 Ac=A 相容. 

f. 若 A 是 /nxn 矩阵，且方程处=*对！1"中某 
个办是不相容的，则 A 不能在每一行都有一 
个主元位置. 

24. a. 每个矩阵方程 Ar 对应一个有相同解集 

的向量方程. 

b- 向量的任何线性组合总可以写成 Ac 的形 
式. A 是适当的矩阵， JT 是适当的向量. 

C. 增广矩阵为 [«, « 2 fc] 的线性方程组的解 
集与方程的解集相同，其中 

A=[fl, « 2 « 3 ]. 

d- 若方程，射=办不相容.则 A 不属于 A 的列 
生成的集合. 

e- 若增广矩阵 [A 幻在 每一行有一个主元位 
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置，则方程儿 c =6不相容. 
f . 若 A 是矩阵，它的列不生成 IT ，则对 
R " 中某个方程儿不相容. 


25. 由等式 

" 4 -3 1" 

5-2 5 

-3' 

-1 

= 

■- 1 — 

-3 


-6 2-3 

_ 2 


10 


( 不用行变换）使 


26.设 I 




M 


-3' 


r 

-3 

=Ci 

5 


_2 

+ c 3 

5 

10 


-6 - 


2 


-3 


，已知 3k-5v- 


解方程 （ 不用行变换） 


'7 3" 

厂 V "1 

'6" 

2 1 

;= 

1 

■5 3 


0 


27. 设 g p g 2 ， g 3 * v 是 R 5 中的向量，4，心,4是标 
量，将向量方程秘 + W 2 +續3 = v 写成一个 
矩阵方程，注意你选用的符号. 

28. 使用符号 v ,, v 2 , …表示向量， c ,, c 2 , …表;标量， 
重写下面的（数值）矩阵方程.给出每个符号 
表示的意义.矩阵方程 如下： 


-3 5 -4 9 1 

5 8 1 -2 -4 



29. 构造一个 3 x 3 非阶梯形矩阵，使得矩阵的列 


可以生成 R 3 . 说明你构造的矩阵具有这种属 


性. 

30. 构造一个 3 x 3 非阶梯形矩阵，使得矩阵的列 
不可以生成 R 3 . 说明你构造的矩阵具有这种 
属性. 

31. 设 A 是 3 x 2 矩阵，说明为什么方程儿不 
可能对所有 R 3 中的向量6都是相容的.推广 
你的结论到任意行数多于列数的矩阵 A . 

32. R 4 中的3个向量能否生成整个 R 4 ? 说明理由. 


当 w >/ t 时， IT 中的 n 个向量是能否生成 IT ? 

33. 设 A 是 4x3 矩阵，6是 R 4 中的任一向量，且 

有惟一解.由此可知 A 的简化阶梯形 
是怎样的？给出理由. 

34. 设 A 是 3x3 矩阵，6是 R 3 中的任一向量，且 
儿有惟一解.说明为什么 A 的列一定可 


以生成 1 R 3 ? 

35 .设 A 是 3x4 矩阵， 力，乃为 R 3 中的向量， 
w = y t +y 2 ,设对 R 4 中的向量 A 和 A ， 
y,=Ax, , y 2 =Ax 2 ■ 为什么方程 Ar = »v 相 
容？ （注： 和* 2 是向量而不是向量中的数值 
元素 .） 


36. 设 A 是 5 x 3 矩阵， j 是 R 5 中的向量， z 是 R 3 
中的向量.又设 Ay = z ， 什么事实使你断定方 
程 /br = 4 z 是相容的？ 

[ M ] 习题37~40中，确定矩阵各列能否生成 K 4 . 


37. 


' 7 2 -5 8" 

-5—3 4-9 

6 10 -2 7 

-792 15 


38. 


'5-7-4 9" 

6-8-7 5 

4 -4 -9 -9 
-9 11 16 7_ 


'12 -7 11 -9 5' 

-9 4 -8 7 -3 

-6 11 -7 3-9 

4 -6 10 -5 12 


40. 


' 8 11 -6 -7 13" 

-7 -8 5 6 -9 

11 7 -7 -9 -6 

-34187 


41. [ M ] 在习题39中去掉矩阵的某一列，使剩下的 
各列仍然可以生成 R 4 . 

42. [ M ] 在习题40中去掉矩阵的某一列，使剩下的 
各列仍然可以生成 R 4 . 能否去掉更多的列？ 
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练习题答案 


矩阵方程 

1 5-2 0' 

-3 19-5 

_ 3— 

-2 

0 

~\ 


等价于向量方程3 

r 

-3 

― 2 

" 5" 

1 

+ 0 

'-2 

9 


" 0^ 

-5 


-7" 

9 

，它表示 


4-8-1 7 

~ 4 _ 


[ 0] 


[ 4」 

1 

-8 


L -1」 

1 

-7」 

1 

■ 0」 



是 A 的各列的线性组合. 

2 側 
一 )=[ 3 2 :] [ ： ]=[ 2 3： 2 ：]=ra 
— d k 縱[網 f 7 2 ] 

1.5 线性方程组的解集 

线性方程组的解集是线性代数研究的重要对象，它们出现在许多不同的问题中.本节使用 
向量符号给出这样的解集的显式表示以及几何解释. 

齐次线性方程组 

线性方程组称为齐次的，若它可写成 Ax = 0 的形式，其中4是 mxn 矩阵而0是 R m 中的零 
向量.这样的方程组至少有一个解.即 1 = 0(®" 中的零向量)，这个解称为它的平 凡解. 对给定 
方程 Ar = 0, 重要的是它是否有非平 凡解， 即满足 Ax = 0的非零向量 at . 由 1.2 节解的存在性与 
惟一性定理（定理2)，得出以下事实. 


齐次方程 Ar = 0 有非平凡解，当且仅当方程至少有一个自由 变量 . 

例1确定下列齐次方程组是否有非平凡解，并描述它的解集. 

+ 5x 2 — 4x 3 — 0 
-3^ - 2x 2 + 4jc 3 = 0 
6x { + x 2 - 8 jc 3 =0 

解 令4为该方程组的系数矩阵，用行化简法把增广矩阵 u 0] 化为阶梯形. 


' 3 

5 -4 

0_ 


「 3 

5 

-4 

0_ 


「 3 

5 

-4 

0' 

-3 

-2 4 

°i 


0 

3 

0 

0 


0 

3 

0 

0 

6 

1 -8 

0 」 


0 

-9 

0 

0 」 


1 

0 

0 

0 

0 


因々 是自由变量 ， Ac = 0 有非平凡解（对&的每一选择都有一个 解）， 为描述解集，继续把 h 0] 
化为简化阶 梯形： 
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0 10 0 
0 0 0 0 



解出基本变量々和 A 得 4 =~^x^,x 2 =0，々是自由变量 ， Ar = 0 的通解有向量形式 




"4 

3^ 


"4' 

3 


V 

3 

= JC 2 

入 


0 

JC 3 

=^3 

0 

1 

=现其中 v = 

0 

1 


这里^由通解向量的表达式中作为公因子提出来.这说明本例中 = 0 的每一个解都是 v 的倍 
数.平凡解可由 jc 3 =0 得到.几何意义下，解集是 R 3 中通过0的直线，见图 1-21. 



注意，非平凡解向量 x 可能有些零元素，只要不是所有元素都是0就行. 
例2单一方程也可看作是方程组，描述下列齐次“方程组”的解集. 


10a ：! -3 a: 2 - 2 x ^=0 

解 这里无需矩阵记号.用自由变量表示基本变量&.通解为 
x x = Q3x 2 +0.2 jc 3 

文 2 和文 3 为自由变量.写成向量形式，通解为 





0.3 jc 2 +0.2 a ：3 


"0.3 jc 2 ' 


~02x^' 

= 

JC 2 

= 

JC 2 

= 

^2 

+ 

0 


_^3_ 


. 又3 


0 


■ X K 


'0.3' 


0.2" 

1 

. 0 j 

+ JC 3 

0 

1- 


2 ,为自由变量） 
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计算表明，方程 （1) 的每个解都是向量《和>»的线性组合，如 （2) 式所示.即解集为 
Span {«, v } ,因为，《不是 1 >的倍数，解集是通过原点的一个平面.见图 1-22. 



例1和例 2 以及后面的练习，说明齐次方程 Air = 0 总可表本为 Span {»> i ， …, Vp} ,其中 v ,,-", v p 
是适当的解向量.若惟一解是零向量，则解集就是 Span {0}， 若方程 Ac = 0仅有一个自由变量， 
解集是通过原点的一条直线，见图 1-21. 若有两个或更多自由变量，那么图 1-22 的通过原点的 
平面就给出 Ac = 0的解集的一个很好的图形说明.注意，类似的图可用来解释 Span {«， W , 即使 
«，v 并不是 /U = 0 的解，见 1.3 节图 1-17. 

参数向置形式 


最初的方程 （ 丨 ） 是例2中的平面的隐式描述，解此方程就是要找这个平面的显式描述，就 
是说，将它作为《和〃所生成的 子集. 方程（2> 称为平面的参数向置方程.有时也可写为 
x = su+tv ( s ,/ 为实数 ) 

来强调参数可取任何实数值，例1中，方程*=為》»(4是自由变量)，或 jc = rv ( r 为实数)，是直 
线的参数方程.当解集用向量显式表示为如例1和例2时，我们称之为解的参数向置形式. 
非齐次方程组的解 


当非齐次线性方程组有许多解时，一般可表示为参数向量形式，即由一个向量加上满足对 
应的齐次方程的一些向量的任意线性组合的形式. 

例3描述 Ac =6的解，其中 



_ 3 

5 -4' 


"i 

A = 

—3 

一 2 4 

、 b = 

—i 


6 

1 -8 


-4 


解这里 A 就是例1的系数矩阵.对 [ A 幻作行 变换得 



■*1 — = — 1 


0 


= 2 
= 0 
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所以 jc , =-1 + ^ c 3 , jc 2 =2, 々为 自由变量， Ax = b 的通解可写成向量形式 


X 2 

\ 4 ' 

-1 + —Jt：3 

2 


-r 

2 

' 4 

3^ 3 

0 

_ 

-1' 

2 

+义3 

_ 4 _ 
3 

0 


x 3 


0 

x 3 


0 

个 


1 

1 ■牛」 


方程 x 二 p + jc 3 i >. 或用 f 表示一般参数. p v 

x = p+tv (f 为实数） （3) 

就是用参数向量形式表示 Ax = 6的解集.回忆例1中 Ac = 0 的解集有参数向量形式 

x = tv U 为实数） (4) 

( v 与 （3) 中的 v 相同），故的解可由向量 p 加上 Ar = 0的解得到.向量 p 本身也是 Ac =办 
的一个特解（在 （3) 中对应 r = 0) • _ 

为了从几何上描述办= 6的解集，我们可以把向量加法解释为平移，给定 R 2 或 R 3 中的向量 v 
与把 p 加上 v 的结果就是把 V 沿着平行于通过卩与0的直线移动，我们称 v 被平移 p 到 v + p ， 
见图 1-23. 若 R 2 或 R 3 中的直线 L 上的每一点被平移/>,就得到一条平行于 L 的直线，见图 1-24. 



图 1-23 v 加上 p , 使 v 平移到 v + p 



设 L 是通过0与 v 的直线，由方程 （4) 表示. L 的每个点加上 p 得到由方程 （3) 表示的平 
移后的直线 • 注意 p 也在直线 （3 > 上.称 （3) 为通过/»平行于 v 的直线 方程. 于是的解 
集是一条通过 p 而平行于 Ac =0 的直线 •图1_25说明了这一结论 • 



图 1-25 Air =* 与 Ac = 0的解集平行 

图 1- 2 5 中 =6 和 Ac = 0 的解集之间的关系可以推广到任 意相容 的方程 Ac =6 ，虽然当自 
由变量有多个时，解集将多于一条 直线. 下列定理给出了这一结论，证明见习题 25. 
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定理6 设方程 = 6 对某个6是相容的， p 为一个特解，则办=6的解集是所有形如 
w = p + h 的向量的集，其中是齐次方程 >U = 0 的任意一个解. 

定理6说明若办=6有解.则解集可由处= 0的解平移向量 p 得到， p 是的任意一 
个特解，图 1-26 说明当有两个自由变量时的 情形. 即使当《>3时，相容方程组 Ac = 6 ( b^O ) 
的解集也可想象为一个非零点或一条不通过原点的线或 平面. 

.躁 

图 1-26 似=»与 At = 0 的解集平行 

警告定理6与图 1-26 仅适用于方程至少有一个非零解 p 的前提下. 

下列算法总结了例1 . 2和3中的计算. 


把相容方程组的解集表示成参数向置形式 

1. 把增广矩阵行化简为简化阶梯形. 

2. 把每个基本变董用自由变董表示. 

3. 把一般解 jc 表示成向量，如果有自由变量，其元素依赖于自由变量. 

4. 把 jc 分解为向董（元素为 常数） 的线性组合，用自由变量作为参数. 


练习题 

1. 下列两个方程都确定 R 3 中的平面，它们是否相交？如果相交的话，描述它们的交集. 

jci+4jc 2 -5x 3 =0 


2. 写出方程10;^-3;^-2;^=7的参数向量形式的通解， 
习题 1.5 

在习题 1~4 中，确定方程组是否有非平凡解， 

使用尽可能少的行运算， 

1- 2 為 一 5x 2 + 8 為 =0 2. x,-3x 2 +7x 3 = 0 

-2x l —7x 2 + x 3 =0 -2x, + x 2 -4x, =0 

4 為 + 2;«: 2 + 7;»: 3 =0 x, + 2x 2 +9x 3 =0 

3. -3x, +5x 2 -7x 3 =0 4. -5jt,+ 7 x 2 +9xj=0 

-6x, + 7x 2 + x 3 =0 x,-2x 2 +6x 3 =0 


讨论这个解集与例 2 中的解集的关系. 


在习题 5、6 中，用例 1、2 的方法把给出的各 
线性方程组的解集用参数向量形式表示出来. 

5. x,+3x 2 + x 3 = 0 6. x,+3x 2 -5x 3 =0 

-4x,-9x 2 +2x 3 =0 x, +4^ 2 -8x 3 =0 

-3x 2 -6x3 =0 -3x,-7 x 2 +9x 3 =0 

在习题 7~12 中，把方程 Ac = 0 的解用参数向 
童形式表示出来，其中4行等价于给定的矩阵. 
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1 3 -3 7"| 8 [1 -2 -9 5 

0 1-45」 _ |_0 1 2 -6_ 



1-4 -2 0 3 -5' 

0 0 1 0 0 -1 

0 0 0 0 1 -4 

0 0 0 0 0 0 

1 5 2 -6 9 0" 

0 0 1 -7 4 -8 

12 ' 0 0 0 0 0 1 

0 0 0 0 0 0 

13. 设某方程组的解集表示为 *,=5 + 4; r ,,; t 2 =-2 - 
7; c 3 ,; c 3 为自由 变量. 用向 童把它 表示成 R 3 中 
的直线. 

14. 设某方程组的解集表示为 

= 2-5 x «,*« 为自由 变量. 用向 童把它 表示成 
R 4 中的直线. 

15. 用例3的方法以参数向童形式表示下列方程组 
的解.给出该解集的几何解释并与习题5的解 
集做比较. 

jc ,+3 jc 2 + x 3 = I 
-4 xi -9 x 2 +2 jc 3 =-1 
-3 jc 2 -6 jc 3 =-3 

16. 和习题15 - 样， 把下列方程组的解集表示出 
来，给出几何解释并与习题6的解集做比较. 

jc ,+3 jc 2 -5 jc 3 = 4 
•^+4 x 2 — 8 jc 3 = 7 
-3 x , - 7 jc 2 +9 jc 3 =-6 

17. 说明和比较 jc ,+9 jc 2 -4 jc 3 =0 与為+9太2- 
4 = -2的解集. 

18. 说明和比较為 一 3 jc 2 + 5 jc 3 = 0与 jc , — 3 x 2 + 5 jc 3 = 4 
的解集. 

在习题19〜20中，求出通过 fl 且平行于6的直 
线的参数方程. 

以 2 °. a= [m 

在习题21~22中，求出通过 p 与的直线 M 


的方程 .（ 提示： A/ 平行于向量 fl-p. 见图 1-27.) 

21. p=[K;] 22. P=[^].9 = [_^] 



在习题23和24中，判断每个命题的真假，并 
给出理由. 

23. a. 齐次方程总是相容的. 

b. 方程 Ar = 0 给出它的解集的显式表达式 • 

c. 齐次方程 At = 0 当且仅当方程至少有一个 
自由变董时有平凡解. 

d. 方程 x = p+» 描述了一条直线，它通过 v 而 
平行于 P. 

e. 方程似=6的解集是所有形如糾=，+ »^的 
向量的集，其中是方程 At = 0的任意一 
解. 

24. a. 若 Jt 是 At = 0的非平凡解，则 Jt 的每个元素 

不等于零. 

b. 方程 + 描述了通过原点的一个平 

面，其中 Jt 2 和 Jt 3 是自由变童，而 B 和V的任 
何一个都不是另一个的倍数. 

c. 方程是齐次的，当且仅当零向童是它 
的解. 

d. 把一个向量加上 p 就是把该向童沿平行于 
p 的方向移动. 

e. 方程如=6的解集可由平移 Ac=0 的解集 
得到 • 

25. 证明定理6: 

a. 设 p 是的解，即却=办，设 V* 为齐 
次方程 Ac = 0 的解， 糾=卩+〜.证明糾是 
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的解. 

b . 设 h ■是 = 的任意解，定义 v A = n >- p , 
证明是 /U = 0 的解.这说明，如=办的 
任意解有形式 H^p + V * , p 是 = 6 的特 
解， v * 是 Af = 0 的解. 

26. 设 Ar = ft 有解，说明为什么当 /U = 0 仅有平凡 
解时，处=«>的解是惟一的. 

27. 设 A 是 3 x 3 零矩阵 （ 所有元素都是零），求方 
程 Ar = 0 的解集. 

28. 若 ft *0, 方程的解集是否可能是通过 
原点的平面？说明理由. 

在习题 29-32 中， （ a ) 方程如= 0是否有非平凡 
解 ， （b ) 方程= ft 是否对每个 ft 都至少有一个解？ 

29. A 是 3 x 3 矩阵，有3个主元位置. 

30. A 是 3 x 3 矩阵，有2个主元位置. 

31. A 是 3 x 2 矩阵，有2个主元位置. 

32. A 是 2 x 4 矩阵，有2个主元位置. 

.- 2 - 6 . 

33. 给定 A = 7 21，用观察法求如= 0的一个 

—3 -9 


非平凡解 . （提 示： 把方程 /U= 0 写成向量方 
程形式 .） 

' 4 -6' 

34. 给定 A= -8 12 ， 用观察法求 At = 0 的一个 
6-9. 

练习题答案 


非平凡解. 

35. 构造一 3 x 3 非零矩阵 A ,使向量 |^1 是如= 0 
的一个解. 

M 

36. 构造一 3 x 3 非零矩阵 A , 使向量 -2 是 Ar = 0 
的一个解. 

37. 构造一 2 x 2 矩阵 A , 使方程 Ar = 0 的解集是一 
条经点 （4,1) 和原点的 R 2 中的直线.随后， 
在 R 2 中找一向量 ft 使的解集不是 R 2 
中平行于 /U = 0 的解集的直线.为什么这与 
定理6没有矛盾？ 

38. 设 A 是 3 x 3 矩阵，少是放 3 中的一个向量，且 
方程 = 无解，讨论是否存在 R 3 中的一个 
向量 z , 使方程 At = z 有惟一解？ 

39. 设 A 是 mx/j 矩阵，《是》”中满足 /U = 0 的向 
量.证明对任一数 C , 向量也满足 Ar = 0. 
( 即证明 A(cu) = 0 .) 

40. 设 A 是 mxn 矩阵， u 和 v 是 R ” 中满足 An = 0 
和 Av = 0 的向量，解释为什么 A (« + v ) —定 
是零向量，以及对每一对标量 c 和为什么 
A(cu + dv) = 0 . 


1 . 行化简增广矩阵 

[1 4 -5 0"|「1 4 -5 0"|「1 0 3 41 

[.2 -1 8 9 j ~[0 -9 18 9 j~[o 1 -2 -lj 


xi + 3 文 3 = 4 
x 2 - 2 xt, = -1 


因此々 = 4 - 3:«: 3 ,:«: 2 =-1 + 2 私 ;^ 为自由变量.通解的向量形式为 


V 


4 - 3 ^,' 


' 4 


3 ' 

X 2 

= 

-1 + 2 ^, 

= 

-1 

+ JC 3 

2 

X 3 


-3 


0 


1 


两个平面的交是通过 p 平行于 v 的直线 . 
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2. 增广矩阵 [10 -3 -2 7] 行等价于 [1 -0.3 -0.2 0.7]，故通解为; c , =0.7 + 0.3; c 2 +0.2々，々和; c 3 是自由 
变量，即 





0.7 + 0.3jc 2 +0.2jc 3 ' 


0.7' 


0.3' 


0.2 

X = 

& 

_^3 


^2 

. 文 3 . 


0 

0 

+ x 2 

1 

0 

+ JC 3 

0 

1 


非齐次方程 Ar 的解集是平移过的平面 p + Span ^ j } ，它经过 p 且平行于例2中的齐次方程的解集. 

1.6 线性方程组的应用 

你也许希望现实生活中涉及线性代数的问题会是只有惟一解，或者可能无解.本节的意图 
是要说明有多解的线性方程组是如何自然产生的.这里的实例来自经济学、化学和网络流. 

经济学中的齐次线性方程组 

本章介绍中提到的500个变量的500个方程组成的方程组，现称为列昂惕夫“投人-产出” 
(或“生产”）模型 . Q 

在 2.6 节将详细讨论这个模型，那时我们有更多的理论和更好的符号.目前，我们先看一 
个简单的“交易模型”，这个模型也是由列昂惕夫提出的. 

假设一个国家的经济可以划分为许多部门，如各种制造、交通、娱乐和服务业.假设我们 
知道每个部门年度的总产出，并精确知道该总产出是如何在其他经济部门进行分配或“交易” 
的.称一个部门产出的总货币价值为该产出的价格.列昂惕夫证明了下面的结论. 

存在能够指派给各个部门总产出的平衡价格，使得每个部门的总收人恰等于它的总支出. 
下面的例子说明如何求平衡价格. 

例 1假设一个经济由煤炭、电力 （ 电源）和钢铁三个部门组成，各部门之间的分配如表 
1-1 所示，其中每一列中的数表示该部门总产出的比例.如表 1-1 的第二列，将电力的总产出分 
配 如下： 40%给煤炭部门，50%给钢铁部门，剩下10%给电力部门 .（ 电力部门把这10%作为运 
转费用 .） 因所有产出都必须分配，每一列的分数之和等于 1. 

记符号价，外，內分别表示煤炭、电力和钢铁部门年度总产出的价格（即货币价 值）. 如果 
可能，求平衡价格使每个部门的收支平衡. 


表 1-1 —个简单的经济问题 


部门的产出分配 

采购部门 

煤 炭 

电 力 

钢 铁 

0.0 

0.4 

0.6 

煤炭 

0.6 

0.1 

0.2 

电力 

0.4 

0.5 

0.2 

钢铁 


O 见 Wassily W. Leontief, “Input-Output Economics ,’，Scientific American, October 1951, pp.15-21. 
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解 某一部门所在的一列表示它的产出的去向，它所在的一行表示它从哪些部门获得了投 
人例如，表 1-1 的第一行说明煤炭部门接受（采购）40%的电力产出和60%的钢铁产出.因为相 
应部门的总产出价格为内和仍，煤炭部门必须支付电力部门 0.4 Pe 美元，支付钢铁部门 0.6 p s 美元， 
因此煤炭部门的总支出是 0.4 p E +0.6 ps 美元.为使煤炭部门的总收人 p c 等于它的总支出，有 

Pc =0.4 Pe +0.6 p s (1) 

交易表的第二行说明电力部门的开支有 0.6 p c 美元采购煤炭， 0.1 p E 美元采购电力，0.2仍美 
元采购钢铁.因此电力部门的收支平衡条件是 


Pe =0.6 Pc +0.1 p E +0.2 p s 
最后，交易表的第三行导出最后的 条件： 

Ps ~ 0.4 pc +0.5 pe +0.2 ps 


( 2 ) 

( 3 ) 


为求解方程组 （ 1)、（2)、（3>,将所有未知量移到方程的左边并合并同 类项. （例如，在 
方程 （ 2 ) 的左边将 p E - 0 . lp E 写成 0.9 p E .) 


Pc -0.4 p E -0.6 ps =0 
-0.6 pc +0.9 p E — 0.2 p s =0 
—0.4 pc ~ 0.5 pE +0.8 ps ~0 

接下来进行行 简化. 为简明起见，数值舍人到小数点后两位. 


1 

- 0.4 

- 0.6 

0 . 


1 

- 0.4 

- 0.6 

0 ' 


•1 

- 0.4 

- 0.6 

0 ' 

- 0.6 

0.9 

- 0.2 

0 


0 

0.66 

- 0.56 

0 


0 

0.66 

- 0.56 

0 

- 0.4 

- 0.5 

0.8 

0 


0 

- 0.66 

0.56 

0 


0 

0 

0 

0 


- 0.4 


- 0.60 0 
- 0.85 0 
0 0 


1 0 - 0.94 0 ' 
0 1 - 0.85 0 
0 0 0 0 


通解是 p c =0.94 p s ,/7 E =0.85 p s ， p s 为自由变量.这个经济问题的平衡价格向量为 



•Pc 


— 0 . 94 Ps — 


0.94 

P = 

Pe 

= 

0 . 85 p s 

=Ps 

0.85 


. Ps . 


. Ps . 


1 


线性代数中的线性方程组 


51 


任意（非负） Ps 取值可以算出平衡价格的一种取值.例如，如果 取内为 100( 或1亿美元）， 
那么 p c =94, p E = 85 .即如果煤炭的产出价格是9 400万美元，电力的产出价格是8 500万美元， 
钢铁的产出价格是1亿美元，那么每个部门的总收人和总支出将会 相等. ■ 

配平化学方程式 

化学方程式描述了化学反应的物质消耗和生产的数量.例如，当丙烷气体燃烧时，丙烷 
( c 3 h 8 ) 与氧 （ 0 2 ) 结合生成二氧化碳 （C0 2 ) 和水 （H 2 0 )，按照如下形式的一个方程式 

(jcOCjHg + (X2)02 —> ( a ：3)C02 + ( a ：4)H20 ( 4 ) 

为“配平”这个方程式，化学家必须找到 JC,， …， JC 4 的全体数量，使得方程式左边碳 （C)、 氢 
(H >、氧 （ 0 > 原子的总数等于右边相应原子的总数 （ 因为在化学反应中原子既不会被破坏，也 
不会被创造）. 

配平化学方程式的一个系统方法是建立描述一个化学反应中每一种类型的原子的数目的一 
个向量方程.由于方程式 （4) 包含三种类型的原子（碳、氢、氧），给 （4) 式的每一种反应物 
和生成物构造一个属于 K 3 的向量，列出每个分子的组成原子的数目 如下： 



y 


0' 


Y 


o' 

c 3 h 8 ： 

8 

，0 2 : 

0 

,co 2: 

0 

， h 2 0: 

2 


0 


2 


2 


1 


要配平方程式（4)， h …，〜的系数必须满足 


"3' 


0 


r 


O' 

8 

+ x 2 

0 

=^3 

0 

+ A：4 

2 

0 


2 




1 


将全部项移到等式左边（修改第三和第四个向量的符号）， 得到： 



'3" 


'0" 


"-1" 


" 0： 


0" 

叫 

8 

+ 太 2 

0 

+ ^3 

0 

+ x 4 

-2 

= ; 

0 


0 


2； 

1 

_-2_ 


-1 


0 


行化简该方程组的增广矩阵得到通解 

，斗“ 2 +,, 3 +，, 4 是自議 

因为化学方程式的系数应为整数，取〜=4,那么;^=1,心=5，而=3.配平的方程式为 
C 3 H 8 +50 2 ^3C0 2 +4H 2 0 

如果方程式中的每个系数乘两倍（比如说），该方程式仍然是配平的.然而在一般情形下， 
化学家倾向于使用全体系数尽可能小的数来配平方程式. 

网络流 

当科学家、工程师或经济学家研究一些数量在网络中的流动时自然推导出线性方程组.例 
如，城市规划和交通工程人员监控一个网格状的市区道路的交通流量 模式； 电气工程师计算流 
经电路的 电流； 以及经济学家分析通过分销商和零售商的网络从制造商到顾客的产品销售.许 
多网络中的方程组涉及成百甚至上千的变量和方程. 
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一个网络包含一组称为接合点或节点的点集，并由称为分支的线或弧连接部分或全部的节 
点.流的方向在每个分支上有标示，流量（速度）也有显示或用变量标记. 

网络流的基本假设是网络的总流人量等于总流出量，且流经一个节点的总输人等于总输出. 
例如，图 1-28 显示 30 单元经过一个分支流人一个节点，為和心标记该节点经过其他分支的流 
出.因为流量在每个节点中是守恒的，我们有 A + X 2 Z 30. 类似地，每个节点的流量可以用一个 
方程描述.网络分析的问题就是确定当局部信息（如网络的输人）已知时每一分支的流量. 


图 1-28 —个节点 


例2图 1-29 中的网络是巴尔的摩市区一些单行道路在一个下午早些时候 （ 以每小时车辆 
数目 计算） 的交通流量.计算该网络的车流量. 



图 1-29 巴尔的摩道路 


解 写出该流量的方程组，并求其通解•如图 1-29 所示，标记道路交叉口（节点）和未知 
的分支流量.在每个交叉口，令其车辆驶人数目等于车辆驶出数目. 


交叉口 车辆驶人数目 车辆驶出数目 

Xl + xi 

300 + x, 

X4+X, 

600 

并且，网络中的总流人量 （500+300+100+400) 等于总流出量（300+々+600)，经简化得 jc 3 =400. 
该方程与上面四个方程联立并重排后得到下面的方程组： 



Xl+X 2 
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300 

500 

600 

400 


行化简相应的增广矩阵得到 


该网络的车流量为 


+為 


= 400 
= 500 


X \ = 600 - x 5 
x 2 = 200 + jc 5 
jc 3 =400 
x A = 500 ~ jc 5 
jc 5 是自由变量 

网络分支中的一个负流置对应模型中显示方向相反的流量.由于本问题中的道路是单行 
线，这里不允许有负值变量.这种情况给变量的可能取值增加了某种限制.例如，因为々不能 
取负值，因此 x 5 < 500. 其他变量的约束在练习题2中有考虑. ■ 


练习题 

1. 假设一个经济有农业、矿业和制造业三个部门.农业部门销售它的产出的5%给矿业部门，30%给制造 
业部门，保留余下的产出.矿业部门销售它的产出的20%给农业部门，70%给制造业部门，保留余下 
的产出.制造业部门销售它的产出的20%给农业部门，30%给矿业部门，保留余下的产出.计算该经济 
的交易表.表中的列给出各个部门的产出如何分配给其他部门. 

2. 考虑例2中的网络流.确定 X ,和灸的可能取值范围.（提 示： 在例中為<500.这对; c , 和:^意味着什 
么？同时 x s >0.) 


习题 1.6 


1. 假设一个经济只有商品和服务两个部门.在每 
一年中，商品部门销售它的总产出的80%给服 
务部门，并保留余下的产出，而服务部门销售 
它的总产出的70%给商品部门，并保留余下的产 

07 WjB 


出.找出商品和服务部门的年度产出的平衡价 
格使得每一部门的收支平衡. 

2. 找出例1中经济的另一组平衡价格.假设同样的 
经济中使用日元而不是美元来衡量各部门的产 
出值，讨论这个问题会有什么变化. 

3. 考虑一个由五金化工、石油能源和机械三个部 
门构成的经济体系.化工部门销售30%的产出 
给石油部门和50%的产出给机械部门，保留余 
下的产出.石油部门销售80%的产出给化工部 
门和10%的产出给机械部门，保留余下的产出. 
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机械部门销售40%的产出给化工部门和40%的 
石油部门并保留余下的产出. 

a . 写出该经济体系的交易表. 

b . 建立方程组表示各部门收支平衡的条件.写 
出对应的增广矩阵以便行化简求平衡价格. 

c . [ M ] 找出当机械部门产出的价格是100个单 
位时的一组平衡价格. 

4. 假设一个经济体系有四个部门，分别是农业 
( A )、 工程 （ E )、 制造 （ M ) 和运输 （ T ) 部门. 
部门 A 销售产出的10%给部门 E 和25%给部门 


NaHCOa + H 3 C 6 H 5 0 7 — Na 3 C 6 H 5 0 7 + H 2 0 + C 0 2 

8. 高锰酸钾和硫酸锰在水中发生化学反应生成二 
氧化锰、硫酸钾和 硫酸： 

KMn 0 4 + MnS 0 4 + H 2 0-^ Mn 0 2 + K 2 S 0 4 + H 2 S 0 4 
(对每种化合物，构造一个向量列出钾、锰、氧、 
硫和氢原子数目 .） 

9. [ M ] 如果可能，使用精确的算术或合理的计算格 
式配平如下的化学反应方 程式： 

PbN 6 + CrMn 2 O g — » Pb 3 0 4 + Cr 2 0 3 + Mn 0 2 + NO 

10. [ M ] 下面的化学反应可以在工业过程中应用， 


M 并保留余下的产出.部门 E 销售产出的 30% 
给部门 A , 35% 给部门 M 和 25% 给部门 T 并保 
留余下的产出.部门 M 销售产出的 30% 给部门 
A , 15% 给部门 E 和 40% 给部门 T 并保留余下 
的产出.部门 T 销售产出的20%给部门 A , 10% 
给部门 E 和 30% 给部门 M 并保留余下的产出. 

a . 写出该经济体系的交易表. 

b . [ M ] 找出该经济体系的一组平衡价格. 

习题 5~10 使用本节讨论的向量方程的方法配 
平化学方程式. 

5. 硫化硼与水剧烈反应生成硼酸和硫化氢气体 
( 臭蛋味）.未配平的方程式为 

B2S3+H2O —> H3BO3+H2S 
( 对每种化合物，构造一个向量列出硼、硫、氢、 
氧的原子数目 .） 

6. 磷酸钠和硝酸钡溶液混合时产生磷酸钡（沉淀 
物）和硝酸钠.未配平的方程式为 

Na 3 P 0 4 + Ba ( N 0 3 ) 2 — Ba 3 ( P 0 4 ) 2 + NaN 0 3 
( 对每种化合物，构造一个向量列出钠、磷、氧、 
钡和氮原子数目.例如，硝酸钡的向量是 
( 0 , 0 , 6 , 1,2 ).) 


如砷 （ AsH 3 ) 的生产.配平方程式. 

MnS+As 2 Cr 10 O 35 +H 2 S0 4 

— > HMn0 4 + AsH 3 + CrS^On + H 2 0 

11. 求下图中网络流量的通解.假设流量都是非负 
的， x 3 可能的最大值是什么？ 



C 


12. a . 求下图中高速公路网络的交通流量的通解. 
(流量以车辆数/分钟计算 .） 

b . 求; c 4 的道路交通封闭时的交通流量的通解. 

c . 当; c 4 =0 时， 4 的最小值是什么？ 


200 



7. Alka-Seltzer 碱性苏打包含重碳酸钠 （ NaHC0 3 ) 13. a. 求下图中网络的交通流量的通解. 

和柠棣酸 （ H 3 C 6 H 5 0 7 )• 当一颗药片溶解在水中 b. 假设流量必须以标示的方向流动，求分支 

时，会发生化学反应生成柠棣酸钠、水和二氧 A ， x 3 ,; c 4 ，; c 5 的流量的最小值. 

化碳 （ 气 体）： 



线性代数中的线性方程组 


流动，求 JC 6 的最小值. 
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14. 英格兰的交叉路通常被设计成单行的“环行 
路”，如下图所示.假设流量必须以标示的方向 

练习题答案 



1. 将比例用小数表示，由于要考虑所有的产出，每列的元素之和等于 1. 这种情况有助于填补空缺的元素. 


部门的产出分配 

采购部门 

农业 

矿业 

制造业 

0.65 

0.20 

0.20 

农业 

0.05 

0.10 

0.30 

矿业 

0.30 

0.70 

0.50 

制造业 


2. 因 jc , 彡 500，由 jc , 和的方程得到； c , > 100和 jc 2 彡 700，由； c 5 彡 0得到； c , 彡 600和 x 2 彡 200 . 因此 
100 彡 JC, < 600和200< JC 2 <700. 


1.7 线性无关 


1.5 节的齐次线性方程组也可从另一观点研究，即把它们写成向量方程.这时，重点从 
/ U =0 的未知数的解转向出现在向量方程中的向量. 

例如，考虑方程 


1' 


'4' 


'2 


0 

2 

+ x 2 

5 

+文3 

1 

= 

0 

3 


6 


0 


0 


此方程当然有平凡解，即; c ,= x 2 =; c 3 =0, 如 1.5 节，主要问题是，平凡解是否是惟一解. 

定义 R ” 中一组向量 { v , ，•..，％}称为 线性无关的， 若向量方程 
x t v t +x 2 v 2 + ••■ + x p v p =0 

仅有平凡解.向量组 （集） { v , ，…， v p } 称为 线性相关的， 若存在不全为零的权 Cl , …， Cp ， 使 
c , v , +C 2 v 2 + ■■■ + c p v p =0 (2) 

方程 （2) 称为向量 v 1 ，…, v p 之间的线性相关关系，其中权不全为零.一组向量为线性相关， 
当且仅当它不是线性无关的.为简单起见，我们也可说 v , ，…， v p 线性相关，意思是向量组（集） 
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{ v , ，…， v p } 是线性相关组.对线性无关组也使用类似的 语言. 
例1设 


L3J L6J 

a . 确定向量组 { v ,, v 2 ， v 3 } 是否线性相关. 

b . 可能的话，求出口^〜七的一个线性相关关系. 

解 a . 我们需要确定方程 （1) 是否有非平凡解，把增广矩阵进行行变换，得 


"1 4 2 0 " 


1 4 2 0 ' 

2 5 10 


0 - 3-30 

3 6 0 0 


0 0 0 0 


显然， 々和; c 2 为基本变量，七为自由变量.&的每个非零值确定 （1) 的一组非平凡解， 
因此 v ,, v 2 , v 3 线性相关. 

b . 为求出 v ,， v 2 , v 3 的线性关系，继续化简增广矩阵，写出新的方程组 


10-20 
0 1 10 
0 0 0 0 


- 2^3 ― 0 
H X 3 =0 
0 = 0 


故 A = 2_ x 3 , a : 2 = u 3 为自由变量.选取為的 一 个非零值，比如; c 3 =5, 则; c , = 10， jc 2 = -5 ， 
把这些值代人 （ 2 ) 得 

10v, -5 v 2 +5v 3 = 0 

这是一个 （ 无穷多个之中的一个）可能的线性相关关系. ■ 

矩阵各列的线性无关 

设我们考虑矩阵 A = [ fl , .•_<!„]，矩阵方程儿 c =0 可以写成 
x x a x -¥x 2 a 2 + ."+i n fl„ =0 

4的各列之间的每一个线性相关关系对应于方程如=0的一个非平凡解.因此我们有下列 
重要事实. 


1 矩阵4的各列线性无关，当且仅当方程 Ac = 0 仅有平凡解. 


例2确定矩阵4= 


的各列是否线性无关. 


解研究 /U = 0, 把增广矩阵行 变换: 


"0 1 4 0 " 


■1 2 

-1 0 ' 


1 2 -1 0 ' 

12-10 
.5 8 0 0 . 


0 1 

0-2 

4 0 

5 0 」 


0 1 4 0 

0 0 13 0 



线性代数中的线性方程组 
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此时，显然方程有3个基本变量，没有自由变量，因此方程 Ar = 0 仅有平凡解， A 的各列 
是线性无关的. ■ 

一个或两个向量的集合 

仅含一个向量，比如说由 v 形成的集合线性无关当且仅当 v 不是零向量.这是因为当 v *0 
时向量方程; c , v =0 仅有平凡解.零向量是线性相关的，因;^0 = 0有许多非平凡解. 

下列例子说明两个向量线性相关的情况. 

例3确定下列向量组是否线性无关 



解 a . 注意 v 2 是",的倍数，即 v 2 =2 v ,. 因此 - Zvi + VfO , 表明 { v u v 2 } 线性相关. 
b . v ,* v 2 的任意一个不是另一个的倍数.它们能否线性相关？设 c 和 d 满足 
cv , + dv 2 =0 

若 c *0, 我们可用〜表示 v , ，即 v ,=(- d / c ) v 2 , 这是不可能的，因 v 1 不是 v 2 & 倍数.故 c 必 
是零.类似地 d 必是0,于是 { Vl ， v 2 } 是线性无关组. ■ 

例3中的讨论说明，你总可以用观察法来决定两个向量是否线性相关.行变换是不必要的， 
只要看一个向量是否是另一个向量的倍数即可（这个方法只能用于两个向量的情况）. 


两个向量的集合 { v ,， v 2 } 线性相关，当且仅当其中一个向量是另一个向量的倍数.这个集 
合线性无关，当且仅当其中任一个向量都不是另一个向量的倍数. _ 

从几何意义上看，两个向量线性相关，当且仅当它们落在通过原点的同一条直线上.图 1-30 
表示例3中两组向量的情况. 



(6,2) # 

Xl (3,2). ( 6 ’2.) 


^ - Xx 

文1 


线性相关 线性无关 

图 1-30 


两个或更多个向量的集合 

下面定理的证明类似于例3的 思路. 详细的证明在本节末给出. 

定理7 (线性相关集的特征） 

两个或更多个向量的集合 S ={ v , ，••.,％}线性相关，当且仅当 S 中至少有一个向量是其他向 
量的线性组合，事实上，若 S 线性相关，且 v , *0,则某个是它前面几个向量 v, ，…， vy 
的线性组合. 

瞥告定理7没有说在线性相关集中每一个向量都是它前面的向量的线性组合，线性 
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相关集中某个向量可能不是其他向量的线性组合.见练习题 3. 

"3i 「r 

例 4设《= 1 , v = 6 ,叙述 u 和 v 生成的集合，并说明向量 w 属于 Span {«, W 当且仅当 

0」 [o 

{«， v , 吣线性 相关. 

解 向量^和〃是线性无关的.因为它们之中任何一个不是另一个的倍数，所以它们生成 
M 3 中一个平面（见 1.3 节），事实上， Span { ii , V } 就是文兩平面 （即; ^=0 >, 若投是 a 和 v 的线 
性组合，由定理7知 { U , V , h >} 线性相关，反之，设 { b ，》 m ^ 线性相关，由定理7知 { U ， v ， 叫中某一 
向量是它前面的向量的线性组合（因 11*0 >,这向量必是 V ，因为 v 不是 a 的倍数.因而 w 属于 
Span { u , v } ,见图 1-31. 



线性相关， >•> 厲于 Span | u .»} 线性无关，》 不钃于 Span|««,H 


图 1-31 R 3 中的线性相关性 ■ 

例4可推广到 R 3 中任意集合 {«， V ， W }, 其中《与》»线性无关.这时集合 {«， v , 幻线性相关当 
且仅当 w 在 B 和 v 所生成的平面上. 

下面两个定理说明了线性相关的一些条件.定理8在今后各章中是一个关键的结果. 

定理8若一个向量组的向董个数超过每个向量元素个数，那么这个向量组线性相关.就 
是说， HT 中任意向量组{»>,,•••,%)，当 p > n 时线性 相关. 

证设 A = [v, ,..•,%]，则 A 是 nxp 矩阵，方程对应于 p 个未知量的 n 个方程，若夕>«, 
未知量比方程多，所以必定有自由变量.因此 Ac = 0 必有非平凡解，所以 A 的各列线性相关， 
图 1-32 给出了这个定理的矩阵说明 • 


P 



图 1-32 若 p > n ，矩阵各列线性相关 ■ 

瞥告定理8没有涉及向量组中向量个数不超过每个向量中元素个数的情形 • 

例5向量线性 相关. 因为每个向量仅有2个元素而共有3个向量， 注意： 



线性代数中的线性方程组 
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其中任何一个向量并不是另一向量的倍数.见图 1-33. 



图 1-33 R 2 中的线性相关集 


定理9 若向量包含零向量， 则它线性相关. 

证把这些向量重新编号，我们可设 v ,=0, 于是方程1， +0. R +••• + (). % =0证明了 S 线 
性相关. ■ 

例6用观察法确定下列向量组是否线性相关. 
















~-2 


" 3" 

V 


"2" 


"3" 


'4 


~2 


"0" 


1 " 


4 


-6 

7 


0 


1 


1 

b . 

3 

， 

0 


1 

C. 

6 

， 

-9 

6 


9 




_8_ 


_5_ 


0 


_8_ 


















10 


15 


解 a . 这个向量组包含4个向量，每个向量仅有3个元素，因此它们线性相关. 

b . 定理8不能应用，因为向量个数不超过每个向量中元素个数.因该组中有零向量，根据 
定理9,因此它线性相关. 

c . 若我们比较两向量的对应元素，第2个向量看来是第一个向量的 -3/2 倍.这个关系对前 

3对元素成立，但对第4个不成立.因此，这两向量中任意一个不是另一个的倍数，因此是线性 
无关的. _ 

一 般地，你必须把每一节完整地读几遍才能理解像线性相关这样的重要概念.学习指导书 
中的这一节的注解对你掌握线性代数中的这一重要思想是很重要的.例如，下列的证明值得一 
读，因它指出如何应用线性无关的定义. 

定理7 (线性相关集的特征）的证明若 S 中某个 v , 是其他向量的线性组合，那么把方程 
两边减去 V ,.就产生一个线性关系，其中 t 的权为（-1)，例如，若 V ,= C2 V 2+C3V3 , 那么 

0 = (- l ) v , + c 2 v 2 + C3V3 +0 v 4 + ■•■ + 0 v i , 

于是 S 线性相关. 

反之，设 S 线性相关，若 n 为零，则它是 S 中其他向量的一个（平凡）线性组合.若不为 
零，存在 C ,， …，~不全为零，使 


CiV, +C 2 V 2 + ■■■ + c „ v p =0 

设） 是使 cfO 的最大下标. 若片 1则 c lVl =0 , 这是不可能的，因故 从1 .而 
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c,Vi + ■■■ + c j v i + Ok ;+ i + ••■ + 0v p =0 

CjVj = - c , v , - Cj ^ Vy ., 



练习题 



" 3" 


-6" 


• (T 


3' 

设《= 

2 

, v = 

1 


-5 

,Z = | 

7 


-A_ 


7 

1 

_ 2」 


-5 


1. 集合{|<^},{1<，1*>}，{1<,2}，>,1*>},卜，2}和{»*^}都是线性无关的吗？为什么？ 

2. 练习题1的答案是否蕴涵着 { U , V ， H «, Z } 也线性无关？ 

3. 为确定是否线性相关，是否有必要验证的线性组合？ 

4. { b , v ， h >, z } 是否线性相关？ 

习题 1.7 


习题1~4中，确定向量组是否线性相关，给出理由. 


'5" 


7" 


■ 9' 


■0. 


_ O ' 


'-3' 

0 


2 


4 

2. 

0 


5 


4 

0 j 


.-6」 


-8 j 


.2. 


-8 


1 

-3 

r -3' 
{ 9 


4 

-\ 

4 

[-2 

1-8 



习题5~8中，确定给定矩阵的各列是否构成线 


性相关集，给出理由. 


5. 


' 0 -8 5" 

3-7 4 

-15 4 
1 -3 2 


6 . 


-3 0' 
0-14 
1 0 3 

.5 4 6 


1 4 -3 0' 

-2-7 5 1 

-A -5 7 5 



习题9~10中， （ a ) 对/!的什么值， v 3 属于 
Span { v „ v 2 } , ( b ) 对 /t 的什么值， { Vl ， v 2 , v 3 } 线性相 
关？ 


1" 


-3' 


' 5' 

-3 

， v 2 = 

9 

， V 3 = 

-7 

.2」 




h 



r 


'-2 


' 2 

10. v ,= 

-5 

， v 2 = 

10 

， v 3 = 

-9 


-3 


• 6 


h 


习题11~14中，求出/!的值，使向量组线性相 
关. 



1 


3 


-1 

11 . 

-1 


-5 


5 


4 _ 


7 _ 


h 


r 


'~2 


' 3 ' 

13 . 

5 


-9 


h 


.-3」 


■ 6 . 


-9 



* 2" 


'-6" 


Y 

12. 

-4 


7 


h 


. 1」 


-3_ 


4 


r 


-5' 


V 

14. 

-i 

-3 


7 

8 


1 

h 


习题15~20中，通过观察判断向量组是否线性 
无关，给出理由. 



5 ■剛 



" 3" 


"0" 


-6' 

17. 

5 

, 

0 


5 


-1 


0 


4 


-8' 


' 2 


19. 

12 


-3 



-A 


-1 



18 [:]，[_ K] 



-r 

-2 _ 

O ' 

20. 

4 

5 

0 


一 7 

3_ 

0 


习题21~ 22 中，判断每个命题的真假.仔细读 


课文，说明你的理由. 


21- a . 若方程 At = 0有平凡解，则矩阵 A 的各列线 
性无关. 




线性代数中的线性方程组 
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b . 若 S 是线性相关集，则 S 中每个向量是其他 
向量的线性组合. 

c. 任意 4x5 矩阵的各列线性相关. 

d . 若 x 和线性无关，而 {x,y,z) 线性相关，则 
z 属于 Span { x , j >}. 

22. a . 两个向量线性相关，当且仅当它们在一条通 

过原点的直线上. 

b . 某一个向量集的向量个数少于每个向量所 
含元素个数，则它线性无关. 

c. 若 x 和线性无关，而 z 属于 Span { x ， j >) ，则 

线性相关. 

d . 若 R " 中一个向量集线性相关，则此集包含 
的向量个数多于每个向量中元素的个数. 

习题 2 3~ 2 6中，给出矩阵可能的阶梯形.使用 
1.2 节例1中的记号. 

23. 4是 3 x 3 矩阵，各列线性无关. 

24. 4是 2 x 2 矩阵，两列线性相关. 

25. 4是 4 x 2 矩阵， 4 =[«i « 2 ]， a 2 不是 a , 的 fg *. 

26. 是 4 x 3 矩阵，/4 = [«, « 2 a,], {“，，〜}线 
性无关，《 3 不属于 Span {«,， a 2 }. 

27. 一 7 x 5 矩阵如果各列线性无关，则它有多少 
个主元列？为什么？ 


28. -5 x 7 矩阵如果其列生成 R 5 ,则它有多少个 
主元列？为什么？ 

29. 构造 3 x 2 矩阵4和 fi 使 Ar = 0 仅有平凡解， 
flr =0 有非平凡解. 


30. a . 填空： “若4是矩阵，则 A 的各列为线 

性无关，当且仅当4有_个主元列 

b . 说明命题 （ a ) 为什么是真的. 


习题31~3 2 中，不使用行变换求解 .（ 提示： 
将 Ar =0 写成向量方程 .） 


31. 给定/1 = | 


" 2 
-5 
-3 



观察到第3列是前两 


列之和.求出 Ar = 0 的一个非平凡解. 


' 4 1 6' 

32. 给定 A = -7 5 3,观察到第1列加上第2 

9-3 3 

列的两倍等于第3列.求 At = 0的一个非平凡解. 
习题 33-38 的每个命题是 （ 在任何情形下）真 
或 （ 至少一种情形下）假.若是假，举例说明该命 
题不是永远为真.这样一个例子称为该命题的一 
个反例.若是真，给出理由（一个特例不能说明该 
命题总是真的）.这里你必须做比习题21~22更多 
的工作. 

33. 若 v , ，…, v 4 属于 R 4 ， v 3 = 2 v ,+ v 2 ,则 { VhVz , 

线性相关. 

34. 若 V ,，…，*> 4 属于 R 4 ， a V3 =0 ,则线 
性相关. 

35. 若”，与〜属于 R 4 , Vl 不是 v 2 的倍数，则 
{ VM 2} 线性无关. 

36. gv , ，…， v 4 属于 R 4 ，而 v 3 不是{^> 1 ，^> 2 , v 4 }的线性 
组合，则 { vw 3 , v 4 } 线性无关. 

37. 若属于 R 4 ， { Vl ， v 2 ， v 3 } 线性相关，则 

也线性相关. 

38. 若 V, ， … ， v 4 是 R 4 中线性无关向量，则 { vw 3 } 
也线性无关.（提示：考虑方程 JCA + 

+ 文 3V3 +0- v 4 =0 . ) 

39. 设4是 mxn 矩阵，且对 R " 中所有*，方程 
Ar =6 至多只有一个解.应用线性无关的定 
义说明 A 的各列必定线性无关. 

40. 设矩阵4有《个主元列.说明为什么对 
R " 中每个方程 At =6至多有一个解，（提 
示： 说明为什么 Ac =6不能有无穷多个解） 

[M] 习题41~ 42 中，求出 A 中尽可能多的列构 
造矩阵 S , 使方程 flr = 0 仅有平凡解 • 解方程 
flr = 0 来证明你的结论. 


41. 


A = 


"8-30-7 2 

-9 4 5 11 -7 

6-224 4 

.5-17 0 10 
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构造 fl 中使用的列 V ， 确定 v 是否属于 fl 的各 
列所生成的集 （ 说明你的计算）. 

44. [ M ] 对习题42中的矩阵 A 和 fl 重复习题43中 
的工作，说明你发现了 什么. 

43. [ M ] 对习题41中的矩阵4和 fl ，选择 A 中未在 
练习 题答案 

1. 是，每一种情况下，任一个向量都不是另一个的倍数.所以每个向量组都线性无关. 

2. 否，练习题1中的观察并不说明线性无关. 

3. 否，检验线性无关性，去检验某个特定向量是否其他向量的线性组合不是好方法.有可能某•向量不 
是其他向量的线性组合而整个向量组仍然线性相关，本题中， if 不是 《, v， Z 的线性组合. 

4. 是，由定理8,向量个数 （4) 超过元素的个数 （3). 



10-6-3 7 10 

-6 4 7 -9 5 

9-9-5 5-1 

-3 1 6-8 9 

7 -5 -9 11 -8 


1.8 线性变换介绍 

矩阵方程 Ax = b 和对应的向量方程 x , a , + •+ x „ a „ =6之间的差别仅仅是记号 _ h 的不同，然 
而，矩阵方程还可以由线性代数中其他问题以及在应用中，例如计算机图形，信号传递等所引 
起，而不仅是直接与向量线性组合的问题有关.通常的情况是把矩阵 A 当作一种“对象”，它通 
过乘法“作用”于向量 x , 产生的新向量称为 Ac . 

例如，方程 



UJ 3J 

t t t t t T 
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乘以矩阵4后，将 x 变成将 II 变成零向量，见图 1-34. 


乘 a 



图 1-34 通过矩阵乘法变换向量 


由这个新观点，解方程 Ax = b 就是要求出 R 4 中所有经过乘以片的“作用”后变为 A 的向量 X . 
由 JC 到批的对应是由一 个向童 集到另一个向量集的函数.这概念推广了通常的函数概念. 
通常的函数是把一个实数变为另一个实数的规则. 

由 R " 到 R " •的一个变换（或称函数、映射> r 是一个规则，它把 R B 中每个向量 X 对应以 R m 
中的一个向量 r ( jc ). 集 R ” 称为 r 的定义域，而 IT 称为 r 的余定义域（或取值空 间）. 符号 r : 
R " — R m 说明 r 的定义域是 R ” 而余定义域是 IT ，对于 R " 中向量 x ， R m 中向量 r ( jc ) 称为 jc (在 
r 作用下）的像.所有像 r (： c > 的集合称为 r 的值域.见图 1-35. 



定义域 余定义域 

图 1-35 RR"—IT 的定义域，余定义域和值域 

本节的新名词是非常重要的，因为矩阵乘法的动态观点对理解线性代数和建立时变物理系 
统的数学模型起着关键 作用. 这样的动力系统将在 1.10 节、 4.8 节、 4.9 节以及第5章进行讨论. 
矩阵变换 


本节以下内容研究有关矩阵乘法的映射.对 R ” 中每个 X ， 7 Xx ) 由如 计算得到，其中4是 
矩阵，为简单起见，有时将这样一个 矩阵变 换记为 x -^如， 注意当 A 有《列时. r 的定义 
域为 K ", 而当4的每个列有 w 个元素时， r 的余定义域为 R ". r 的值域为 a 的列的所有线性组 
合的集合，因为每个像 r ( x ) 有的形式. 


例1 
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c . 任意 X ，若它在 T 下的像是 ft ， 它必满足 （1), 由 （2) 知方程 （1) 的解是惟一的，所 
以仅有一个 JC 使它的像是 ft . 

d . 若^是® 2 中某个 JC 在7下的像.则它属于 r 的值域，也就是说，对某个 X ， c = T ( x ), 
这就是说，要问方程组 Ac =<：是否相容，为找出答案，把增广矩阵进行行 变换： 



第3个方程是0=-35,说明方程组不相容，因此 c 不属于 r 的值域. ■ 

例1 ( c ) 的问题是方程组的惟一性 问题： d 是否 R ” 中惟一的 jc 的像？类似地，例1 ( d ) 
是存在性 问题： 是否存在 R " 中 jc 使它的像为 c ? 

下列两个矩阵变换有很明确的几何意义，它们加强了矩阵作为向量变换的动态观点 ， 2.7 
节包含了其他有关计算机图形学的有趣例子. 

"1 0 0 ' 

例 2 若八= 0 10, 则变换 jcbAt 把 11^ 中的点投影到 jca 坐标平面上，因为 
0 0 0 

x t ' "1 0 O ' x,' x, 

^2 l-> 0 1 0 x 2 = x 2 

Xi 0 0 0 x 3 0 

见图 1-36. 

x, r^ 

图 1-36 投影变换 ■ 

例 3 设^|，变换 r : R 2 -> R 2 定义为 r ( jc ) = Ac 称为剪切 变换. 可以说明，若7'作 

用于图 1-3*7 的 2 x 2 正方形的各点，则像的集构成带阴影的平行四边形.关键的想法是证明 r 
将线段映射成为线段 （ 如习题27所示），然后验证正方形的4个顶点映射成平行四边形的4 

个顶点•例如’点“喵_ ㈣ )$ 观 [ 6 j，[x 将正方形 

变形.正方形的底保持不变，而正方形的顶拉向 右边. 剪切变换出现在物理学、地质学与晶 
体学中. 
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绵羊 剪切变换后的绵羊 

图 1-37 剪切变换 ■ 


线性变换 

1.4 节定理5表明，若 A 是 mx /* 矩阵，则变换有以下性质. 

A ( u + v ) = Au + Av 和 >4(01) = cAu 

«,»>是1«"中任意向量. c 是任意数.这些性质若用函数记号来表示，就得到线性代数中最 
重要的一类变换. 


定义 变换（或映射） r 称为 线性的 ，若 

( i ) 对 r 的定义域中一切 b ， v ， T ( u + v ) = T (. u )+ T ( y ). 

( ii ) 对一切 k 和标量 ' c ， T ( cu ) = cT { u ). 

每个矩阵变换都是线性变换，非矩阵变换的线性变换的重要例子将在第 4. 5章中讨论. 
线性变换保 持向量的加法运算与 标 量乘法运算. 性质 （ i ) 说明先将 R ” 中的 《 和相加然后 
再作用以 r 的结果 na + v ) 等于先把 r 作用于《和 V 然后将 R " 中的 r ⑻和 r ⑻相加.由这两个 
性质容易推出下列 性质： 


若 r 是线性变换，则 


7(0) = 0 

(3) 

且对 r 的定义域中一切向量《和》»以及数 C 和 有： 


T ( cu + dv ) = cT ( u )+ dT ( r ) 

(4) 


性质 （3) 由 （ u ) 得出，因 r(o)=r(o«i)=or ⑻=0•性质 （4) 由 （ i ) 和 （ ii ) 推出： 

T(cu + dv) = T{cu)+T(dv) = cT(u)+dT(y) 

若一个变换满足 （4>， 它必是线性的.（取 c = rf = l 可得 （ i )， 取 rf =0 可得 （ ii ).) 重复应 
用 （4) 得出有用的 推广： 

r ( c , v , + • • ■ + c„v„ ) = c,T{v, )+---+ c„T(y„ ) ( 5 ) 

在工程和物理中， （5) 式称为叠加原理.设想…，卜为进人某个系统的信号， 
?>,)，…， r ( Vp ) 为系统对这些信号的响应.系统满足叠加原理.若某一输人可表示为这些信号的 
线性组合，则系统的响应是对各个信号的响应的同样的线性组合.我们将在第4章研究这一思 
想 • 


例4给定标量/•，定义为 r ( jc ) = n ：. 当0彡1^1时， r 称为压缩变换，当/ '>1 




线性代数中的线性方程组 


时7■称为拉伸变换.设 r =3， 证明 r 是线性变换 • 

解设属于 K 2 ， c , rf 为数.则 

T(cu+dv) = 3( cii +£ iv ) 

= 3cu-{-3dv 1 

= c (3«)+ J (3 v)J 
= cT(u)+dT(v) 

因满足 （4)， 于是 r 是线性 变换. 见图 1-38. 



例5定义线性变换 r : ne -^ R 2 为 



注意 r («+ v ) 等于 r ⑻+7•⑻.由图 1-39 可知， r 把 1 /,»>和《+»»逆时针向旋转 90°. 事实上， 
r 把由《和》>确定的平行四边形变换成由 7 x «),: r ( v ) 确定的平行四边形（见习题 28). 



图 1-39 旋转变换 


最后的例子不是几何的，它说明线性变换如何把某一类型的数据变成另一种类型的数据. 
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例6某公司生产两种产品 B 和 C . 使用 1.3 节例7中的数据，我们构造“单位成本”矩阵 
U=[b c ] ,它的各列描述“每美元产出成本”. 


产 品 
B C 

"0.45 0.40" 
U = 0.25 0.35 
0.15 0.15 


材料 

劳动 

管理 


设 ； c = ( x u x 2 )S “产出”向量，对应于产品 B 和 x , 美元及产品 C 和; c 2 美元，定义 r : R 2 — R 3 
为 



"0.45" 


0.40 


> 才料总成本^ 

T ( x)=Ux = x t 

0.25 

+ x 2 

0.35 

= 

劳动总成本 


0.15 


0.15 


管理 总成本_ 


变换 r 将一列产出数量（以美元计算）变换为一列总成本.该变换是线性的，体现在两方面： 

1. 若产量增加4倍，由； c 增加到 4 x , 则成本也乘以同一因子，由 r ( x ) 增加到 4 r ( x ). 

2. 若； c 和: y 为产出向量，则对应产出向量; C + J 的总成本恰好等于成本向量 r (; c ) 和 7(30 之 

和. ■ 

练习题 


1. 设7':]» 5 4]» 2 ,7'(;<：)=处，4为某个矩阵，X属于 R 5 ，A 应有几行几列？ 

2. 设 A = C _°j. 给出变换 xm Ac 的几何解释. 

3. 由0到向量 u 的线段是形如 ni 的点的集合，其中证明线性变换 r 把这个线段变为0到 7Xu) 的 
线段. 


习题 1.8 

1. 设4 = |^ 定义 n 2 — R 2 为 r(x) = Ac , 
求出 u = [ :] 与 *■ = 


'0.5 

0 

0 


r 


a 

0 

0.5 

0 

，《= 

0 

，v = 

b 

0 

0 

0.5 


■-4」 


c 


r : r 3 — r 3 为 t(x) = 处，求 r(u) 和 r(v). 

习题 3~6 中，定义 r(x) = Ac ，求出 x 使它在 r 
下的像为 ft， 并判断X是否惟一. 


I 在 r 下的像. 
b 


' 1 0 - 2 ] r -r 

3. A= -2 1 6 , b = 7 

3-2-5 -3 


4. A = \ 

■1-3 2" 

0 1 -4 

， b = 

_ 6 _ 

-7 


3-5-9 」 


-9 



1 

-2 r 


r 

3 

-4 5 

， b = 

9 

0 

1 1 


3 

-3 

5 -4 


-6 
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7. 设 A 是 6 x 5 矩阵，为了定义 T ( x ) = 
Ax , a 与应为多少？ 

8. 为了定义从 IR 4 到 R 5 的映射 r ( x ) = Ac ,矩阵 A 
应有几行几列？ 

习题9~10中，求出 R 4 中所有 X ，它在变换 
x ^ Ac 下映射为零向量. 


-5 


1 -4 
-6 6 



■13 

9 

2 

10. A = 

1 0 

3 

-4 


0 1 

2 

3 


-2 3 

0 

5_ 


11. 设* = 


， A 为习题9中的矩阵， ft 是否属 


于线性变换 x ^ Ac 的值域? 


12. 设 ft : 


, A 为习题10中的矩阵， ft 是否属于 


线性变换的值域？ 

习题13~16中，在直角坐标系下标出向量 

« = gj,v 和它们在变换 r 下的像 （ 每题画一 

个图），给出变换 r 对 R 2 中向量 x 的作用. 

0 -：][：] 


13. T ( x )-- 


14. T ( x ) = 


0.5 0 j 

0 0.5 


]t] 
[：：][：] 
㈡ t] 


15. T ( x )-- 

16. T ( x )= 

17. 设 r : R 2 -> R 2 是线性变换，把 


变为 


□，把 J 变为[_;]， 利用 r 是线性变换 

的事实求出向量 3 u ，2 v ，3 u + 2 v 在 T 下的像. 
18. 下图给出向量 u ， v , h > ， 以及在线性变换 
r : R 2 4 R 2 的作用下 r ( u ) 和 r ( v ) 的像. 画出 


r ( w ) 的像.（提 示： 首先将 w 写成《和*>的线 
性组合 .） 


19 . 设 

— R 2 是线性变换，把 e , 变 为，， 把6 2 变为 
^ 求、 

20 . 设， = ㈡ ， vl = [ m ， r : K2 ‘是 
线性变换，把 x 映射为 jc , v ,+; c 2 v 2 ，求矩阵 A ， 
使对每个 X ， T ( x ) = Ax . 

习题21~22中，判断每个命题的真假，并说明 
理由. 

21. a . 线性变换是一种特殊的函数. 

b . 若 A 是 3 x 5 矩阵， T 是由 r ( x ) = Ac 定义的 
变换，则 A 的定义域是 R 3 . 

c . 若 A 是 mx / j 矩阵，则线性变换 xh Ac 的值 
域是 IT . 

d . 所有线性变换都是矩阵变换. 

e . 变换 r 是线性的，当且仅当对任意 r 的定义 
域中的 V ,, v 2 * 所有数 Cl , C2 都有 

T ( C , V , + c 2 v 2 ) = c , r ( v ,) + c 2 T ( v 2 ) 

22. a . 所有矩阵变换都是线性变换. 

b . 变换 Ac 的余定义域是 A 的列的所有线 
性组合所构成的集合. 

c . 若 r : ir — nr 是线性变换， c 在 nr 中，则 
惟一性问 题是： “ c 是否在 r 的值域 中？” 

d . 线性变换保持向量加法和标量乘法运算. 

e . 叠加原理是线性变换的物理表述. 

23. 设 r 是把点映射为它关于; C , 轴的对称点的线 
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性变换 r : R 2 — R 2 . (见练习题 2 .) 画出类似 
图 1-39 的两个图，说明线性变换的性质 （ i ) 
和 （ii ). 

24. 设向量 v ,，...， v p 生成 nr ， r : iT4ir 是一线性 
变换， r ( v ,) = o , i = \, -,p ,证明 r 是零变换， 
即若 X 是 R " 中的任一向量，则 r ( x ) = 0 . 

25. 给定 R" 中向量 v*0 和 p , 通过 P 方向为 V 的 
直线有参数方程 x = p + /v . 证明线性变换 
r : ir — ir 把此直线映射到另一条直线或一 
点 （ 称为退化直线） 上. 

26. 设 u,v 为 R 3 中线性无关向量， P 是通过 u , v 和 
0 的平面， P 的参数方程为 

•* = _su + / vC ? 〆 为实数）. 

证明任意线性变换 r : R 3 — R 3 把 p 映射为通 
过 0 的一个平面，或通过 0 的一条直线，或仅 
是 R 3 中的原点.为了使平面 P 的像是平面， 
r ( u ) 和 r ( v ) 应满足什么条件？ 

27., a. 证明通过 R" 中向量 p 和 0 的直线可写成参 
数方程 x = ( l-Op + 項.（参阅 1.5 节的习题 
21 和 22 中的图 .） 

b . 由 p 到？的线段可表示为所有形如 
i }~ t)p + tq , ( 0 彡？彡 1 ) 的点的集合（如下 


图所示 ） .证明任意一个线性变换 r 把此线 
段映射为一条线段或一个单独的点. 

(/ =1) 彳 


28. 设《和 v 是 nr 中的向量，可以证明，由《和》« 

所确定的平行四边形内所有点的集 p 可表示 
1kau + bv , 0 < tz < 1 , . 设 r : R "— R " 

为线性变换，说明为什么 p 内一点在 r 下的像 
是在由 r («) 和 r ( v ) 确定的平行四边形内. 

29. 定义 /:M — M 为 /( ； c) = m^ + fc . 

a . 证明当 ft = 0 时，/是线性变换. 



b . 求出线性变换的一个性质，使当时， 
/不满足. 

c . 为什么称/为线性函数？ 

30. 仿射变换 Pir — ir 有形式 r ( jc )= Ar + ft,A 
为 mxn 矩阵， ft 属于 R " ,证明当办矣❶时 ， r 
不是线性变换 ( 仿射变换在计算机图形学中很 
重要）. 


31. 设 Pir — ir 为线性变换，设 { v ,， v 2 , v 3 } 为 R " 
中线性相关集，说明为什么集 { r ( v ,)， r ( v 2 ), 
r ( v 3 )} 线性相关. 

习题32~36中，将列向量写成行的形式，如 

x = (x uXl ) , T(x) = T(x uXl ). 

32. 证明由 r ( u 2 ) = (4; c ,-2; c 2 ,3|; c 2 |) 定义的变换 
r 不是线性的： 

33. 证明由 x t + 4 , 5 jc 2 ) 定义的 
变换 r 不是线性的. 

34. 设 rw — ir 为线性变换.证 明:若 r 把两个线 
性无关向量映射为线性相关集，则方程 
r (*) = o 有非平凡解•（提 示：设 r " 中 u * v 线 
性无关，但 r ( u ) 和 r ( v ) 线性相关.则 
c , r ( u )+ c 2 r ( v ) = o 对某个不全为零的权 Cl 和 
c 2 成立，然后使用这一方程 .） 

35. 设 r ： R 3 ^ M 3 为一变换，它将向量 
x = (x„x 2 ,x,) 映射为关于平面 ; c 3 =0对称的点 
nx ) = T ^ Xl - x ,) , 证明 r 是一线性变换.（思 
路参见例 4.) 


36.设 7" : R 3 — R 3 为一变换，它将向量 * = ( x u x 2 , x ,) 
映射到平面 a = o 上，即 r ( jc ) = r (； c ,， o ,； c 3 )， 证 
明 r 是一线性变换. 


[ M ] 习题 37 〜 38 中，给定矩阵确定了一个线性 


变换 r . 求出使 r ( jc ) = o 的所有 JC . 


37. 


' 4 

-2 

5 

- 5 - 


"-9 

-4 

-9 

4 

—9 

7 

-8 

0 

38. 

5 

-8 

-7 

6 

-6 

4 

5 

3 

7 

11 

16 

-9 

_ 5 

-3 

8 

-4 


9 

-7 

-4 

5_ 
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'1 



-7' 

39. [\1] 设办 = 

5 

9 

, A 为习题 37 中的矩阵， ft 是否 

40. [\1] 设办 = 

-7 

13 


7 



-5_ 


，设 A 为习题 38 中的矩阵， ft 是 


属于变换 Ac 的值域？若 如此； 求出在变 否属于变换 xh Ac 的值域？若是，求出在变 

换 r 下的像为 ft 的 X . 换 r 下的像为 ft 的 X . 


练习题答案 


1. A 必须有 5 列， Ac 才有定义. A 必须有 2 行， T 的余定义域才能是 R 2 . 

2. 在坐标系中任 意取一 点看看会发生什么.例如 （ 4, 1) 映射为 （ 4, -1), 变换 xh Ac 把 点映射为它关 
于; c 轴 （或; c, 轴） 的对 称点. 见图 1-40. 



A 

iU 

X 

,| 

1 'I* 1 

Av - 

< 

i 

' \ ' 
、 L 

i 


变痪 j ： H » Ar 
图 1-40 


3.设 x = m , ,因 T 是线性变换， ntu ) = tT ( u ), 它是连接0和 r ( u ) 的线段上的点. 


1.9 线性变换的矩阵 


当一个线性变换 r 是由几何中提出来或用语言叙述时，我们通常希望有关于 ru ) 的公式. 
下面的讨论指出，从 R " 到 1 T 的每一个线性变换，实际上都是一个矩阵变换 Ac , 而且变换 
r 的性质都归结为 a 的性质.寻找矩阵 a 的关键，是了解 r 完全由它对单位矩阵/„的各列的作 
用所决定. 


例1 



的两列是 A 




，设 r 是 r 2 到 r 3 的线性变换，使 


T{^) = 

r 5- 
- 7 | 

- T (^) = 

"-3" 

8 

! 



0 



求出 R 2 中任意向量; C 的像. 
解写出 
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由步骤 （ 到 （2) 说明为什么只要知道7>,)和7> 2 )就可由任意; c 决定 r(;c) ， 此外，因 
(2) 把 T ⑷表示为7>,)和7> 2 )的线性组合，我们可把这些向量作为矩阵 A 的各列，而把 （2) 
式写成 

T { x ) = [ T { e ,) T ( e 2 )] ^'j = Ac 

定理10 设为线性变换，则存在惟一的矩阵 A ， 使 
T ( x ) = Ax » 对 IT 中一 切 x 

事 实上， A 是 mxn 矩阵，它的第 j 列是向量7>;) ， 其中是单位矩阵夂的第 ） 列： 

A = [7( c ,) ••- T { e n )] ( 3 ) 

证 iBx = /„x = [ c , …由于 r 是线性变换，知 
r( I) = r(jc,e, + • • • + n) = jcJXe,) + …+ Ard) 


= [r(e,) … T(e n )] \ =Ax 

A 的惟一性在习题 33 中研究. ■ 

(3) 中矩阵 A 称为线性变换 r 的标准 矩阵. 

现在我们知道，由 K " 到 IT 的每个线性变换都是矩阵变换，反之 亦然. 术语 线性变 换强调 
映射的性质，而矩 阵变换 描述这样的映射如何实现.如下例所示. 

例2对拉伸变换 r (； c ) = 3; c ，求标准矩阵. 

解写出 
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n«i) = 3e, 



■ 


例3设 r : R 2 — R 2 为把 R 2 中每一个点逆时针旋转角度中的 变换- 我们可以证明这个变 
换是线性变换（见 1.8 节图 1-39), 求出这个变换的标准矩阵. 


解旋转 成为 ㈡ J 旋 转成为 [二1, 姻 ⑷ 


(-sin 

、、 cos 咏-一 

n 

\ (cos 9, sin 9) 



「 ;0.0) 


图 1-41 旋转变换 


由定理10, 



1.8 节例5是这个变换的特殊情形，其中中 = ii /2. 


R 2 中的几何线性变换 

例2和例3说明了几何中的线性变换，表 1-2-1-5 说明了其他常见的平面几何线性变换.因 
这些变换都是线性的，它们完全由它们对/ 2 的各列的作用确定，而不是仅表示 e , 和的像，下 
列各表说明了这些变换对单位正方形的作用（见图 1-42). 



图 1-42 单位正方形 


其他的变换可以通过表 1-2-1-5 所列出的变换通过复合构造出来，即一个变换之后再作另 
一个变换，例如，作一个水平剪切变换后再作一个关于 x 2 轴的对称变换 .2.1 节将证明，线性变 
换的复合仍是线性的（见习题 36). 



















存在与惟一性问题 


线性变换的概念给出一种新的了解以前提到的存在惟一性问题的观点，下列两个定义给出 
与变换有关的术语. 

定义映射称为到 R " 上的映射，若 1 T 中任一 ft 都至少有一个 R " 中的 X 与之 
对应.（也称为满射 .） 

等价地，当 r 的值域是整个余定义域] IT 时， r 是到 R - 上的.也就是说，若对 ET 中每个*， 
方程 7 Xx )=6 至少有一个解. “ r 是否把 R " 映到 R ” 上？”是存在性问题.映射 r 不是到 ET 上的， 
若 ET 中有某个 h 使方程 T(x)=b 无解.见图 143. 



r 不是到 R " 上的 7■是到 R " 上的 

图 1-43 是否 r 的值域是整个 IT 

定义映射 LIT — R " ■称 为一对一映射 （或1:1 ), 若 ET 中每个是 R ” 中至多一个 JC 的像. 
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(也称为单射 .） 

等价地， r 是一对一的，若对 R " 中每个 ft ， 方程 7 XJC ) =6有惟一的解或没 有解. “ r 是否是 
一对一的？ ”是惟一性问题.映射 r 不是一对一的，若中某个6是 R ” 中多个向量的像.若没 
有这样的 r 就是一对一的.见图 1-44. 



r 不是一对一 7•是一对一 

图 1-44 是否每个6是至多一个向量的像 


表 1-5 中的投影变换不是一对一的，也不能将 R 2 映上到 R 2 . 表1-2、 1-3 和 1-4 中的变换是 
一对一的，能将 R 2 映上到 R 2 . 其他可能性在下面的两个例子中给出. 

例4及随后的定理说明了关于一对一映射与映上映射的函数性质是如何与本章以前的一些 
概念关联起来的. 

例4设 7" 是线性变换，它的标准矩阵为 

•1-4 8 I 

A = 0 2-13 

0 0 0 5 

T 是否把 R 4 映上到 R 3 ? 7■是否一对一映射？ 

解 因 A 已经是阶梯形，可以立即看出， A 在每一行有主元位置，由 1.4 节定理4,对 R 3 
中每个方程 Ac 相容，换句话说，线性变换7将 IR 4 (它的定义域）映射到 R 3 上.然而因 
方程 Ac =6有一个自由变量（因为有 4 个变量，仅有3个基本变量），每个都有多个 jc 的像， 
所以 r 不是一对 一的. ■ 

定理11 设 了：股" — ET 为线性变换，则 r 是一对一当且仅当方程 Ac =0 仅有平凡解. 

证因 T 是线性的，7(0) = 0,若7是一对一的.方程700 = 0至多有一个解，因此仅有零 
解. 若 r 不是一对一的，则 IT 中某个办是至少 R " 中两个相异向量，比如说是 K 和 V 的像，即 
T ( u )= b ， T ( v )= b ， 于是因 r 是线性的. 

7'(«- v )=7'( h )-7( v ) = *-* = 0 

向童 《- v 不是零，因此方程有多于一个解.因而定理中两个条件同时成 
立或同时不成立. ■ 

定理12设 r:®”—ir 是线性变换，设 a 为 r 的标准矩阵，则 

a. ；T 把 R” 映上到 ET, 当且仅当 4 的列生成 IT. 

b . ； T 是一对一的，当且仅当/\的列线性无关. 
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证 a. 由 1.4 节定理4, A 的列生成 R" 当且仅当方程 Ac =6对每个6都相容，换句话说， 
当且仅当对每个方程 r(jc) = £» 至少有一个解，这就是说， T 将 R” 映射到 IT 上. 

b. 方程 roc)=o 和 Ac=o 仅有记法不同.所以由定理11， r 是一对一的当且仅当 /u=o 仅 
有平凡解，在 1.7 节 （3) 的命题已说明，这等价于 A 的各列线性 无关. ■ 


定理12的命题 （a) 等价于命题“了把股”映上到®",当且仅当 ET 中的任一向量都是 A 的 
列的一个线性组合参见 1.4 节定理 4. 

下例以及习题中，我们把列向量写成行的形式，如1 =(為,々），将 r(x) 写成八々,々），以代 
替更正式的^((心七)). 

例5设7'(4,4) = (3為+; (2 ,54+7知々+3；0,证明7'是一对一线性变换. 7是否将 R 2 映上 


到 R 3 ? 

解当 x 和 7Xx) 写成列向量，容易通过检査 Ac 中每个元素的行-向量计算看出 T 的标准矩阵. 


3aci + x 2 
r(jc)= 5 jcj +7jc 2 


jci +3jc 2 



(4) 


k 

故 r 的确是线性变换，它的标准矩阵如 （4) 所示 . a 的列是线性无关的，因为它们互相之 


间不是倍数关系，由定理 12(b)，r 是一对一的.为确定 r 是否从 R 2 到 K 3 的映上映射，观察 a 
的各列生成的向量集.因 A 是 3x2 矩阵，由定理4可知， A 的列生成 R 3 当且仅当4有3个主元 
列.这是不可能的，因 A 仅有2列，所以 A 的各列不能生成 R 3 , 对应的线性变换不是映上到 R 3 


的.如图 1-45 所示。 
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练习题 


设 r : R 2 -> R 2 为一个线性变换，它先作水平剪切变换，将〃 2 映射为 62-0.56, (但^不变），然后再做 
关于 x 2 轴的对称变换.假设 r 是线性的，求它的标准矩阵 .（ 提示： 确定^和^的像的最终位置 .） 


习题 1.9 

在习题1~ 10中，设 r 是线性变换，求出 r 的 

标准矩阵. 

1 . r ： R 2 -» r , r ( e ,) = (3, l ,3, l ), r ( e 2 ) = (-5, 2,0,0)， 
其中 ei =( l ,0), e 2 =(0, l ). 

2 . r ： R 3 -> R 2 , r ( e ,) = ( l ,3), r ( e 2 ) = (4,-7), r ( e 3 ) 
=(-5,4), 其中 <?1 ，《^ 3 是3><3单位矩阵的列. 

3. r : R 2 -> R 2 将点绕原点逆时针旋转 371/2 弧度. 

4. r : R 2 -> R 2 将点绕原点顺时针旋转 -71/4 弧度. 
(提 示： r ( e ,) = ( l / V 2- l / V 2).) 

5. r : R 2 -» R 2 是垂直剪切变换， 将 61 映射为 
e ,-2 e 2 而保持向量 e 2 不变. 

6. 7' : 虻->虻是水平剪切变换，将〜映为《 2 +3« 1 
而保持向量 e , 不变. 

7. r : R 2 -» R 2 先绕原点顺时针旋转 -3 JI /4 弧 
度，再关于水平 A 轴作对称变换 .（ 提示： 

r ( e ,) = ( l / V 2 -1/ V 2).) 

8. r : R 2 -> R 2 先关于水平々轴作对称变换，再关 
于直线作对称变换. 

9. r : R 2 -> R 2 先作水平剪切变换，将《 2 映为 
e 2 -2 e , 而保持向量 e , 不变,再关于直线 x 2 = -心 
作对称变换. 

10. r : R 2 -> R 2 先关于垂直 x 2 轴作对称变换，再绕 
原点顺时针旋转71/2弧度. 

11. 线性变换 r : R 2 -> R 2 先关于4轴作对称变换， 
再关于 x 2 轴作对称变换.证明 r 也可被描述 
为一个绕原点旋转的线性变换.旋转的角度 
是多少？ 

12. 证明习题8中的变换只不过是一个绕原点的旋 
转.旋转的角度是多少？ 

13. 由线性变换 r : R 2 -» R 2 得到的 7(^), r ( e 2 ) 向 
量如下图所示，画出向量 r (2， i ). 



14. 线性变换 r ： R 2 -» R 2 的标准矩阵是 
^4 = [«1 « 2 ] . 其中如下图所示，画出 

在变换 r 下的像. 



习题15~16中，填上矩阵中未写出的元素， 
假设方程对变量的所有值都成立. 



■? ? ?• 

Xi' 


3^i - 2x y 

15. 

? ? ? 

x 2 

_l 



? ? ? 

X 3 


Xi~X 2 ^ x 3 

16. 

[：：][：]= 

Xi -X 2 

-2x { + ^2 

. 


习题17~20中，通过求出映射相应的矩阵， 
证明 r 是线性 变换. 注意 x ,, x 2 , …是向量中的元素 
而非向量. 

17. T ( x u X2 , x iy x a ) = ( 0 , x i + Xi,Xi + x,,Xi + x 4 ) 

18. r(x,, x 2 ) = (2x 2 - 3x,, X, - 4x 2 ,0, x 2 ) 

19. T { x l , x l , x i ) = { x i - 5 x z + Ax - s , x 1 - 6 x i ) 

20. T ( x u x 2 , x 3 , x a ) = 2 x , + 3 x 3 -4 x 4 (7: R 4 R ) 

21. 设 r : R 2 - » R 2 为使 r ( x ,, x 2 ) = ( x , + x 2 ,4 x , +5 x 2 ) 
的线性变换，求出使 r (; r ) = (3,8)_ 
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22. 设 r : R 2 -» R 3 为线性变换， T(x u x 2 ) = (x l -2x 1 , 
-x i +3x 2 ,3x 1 -2x 2 ) , 求出 x ，使 r ( x ) = (- l ，4,9). 
习题23~24中，判断各个命题的真假，给出理由. 

23 . a . 线性变换 r : ir -» iir 完全由它对单位矩阵 

/„的作用确定. 

b . 若 r : R 2 -> R 2 把向量绕原点旋转一角度 
(P ,则 r 是线性变换. 

c . 两个线性变换的复合不一定是线性变换. 

d . 映射 r : ir -» iir 是把 nr 映上到 ir 的，若 
R " 中每个向量 x 映射到 IT 中的某个向量. 

e . 若 A 是 3 x 2 矩阵，则变换 xbAc 不是一 
对一的. 

24. a . 并非每个从 R ” 映射到 R - 中的线性变换都 

是矩阵变换. 

b . 线性变换的标准矩阵的各列就 
是 nxn 单位矩阵的各列的像. 

C. 从 R 2 映射到 R 2 中的线性变换对点作关于 
水平轴，垂直轴或原点的对称变换，则其标 

准矩阵的形式是 g 其中《和4等于 ±1. 

d . 映射是一对一的，若 it 中每个 
向量映射成为 R " 中惟一的向量. 

e . 若 A 是 3 x 2 矩阵，则变换 xbAc 不可以 
将 R 2 映上到 R 3 . 

习题25〜28中，判断给定的线性变换是否是 
( a ) 一对一的， （ b ) 满射，给出理由. 

25. 习题17中的线性变换. 

26. 习题2中的线性变换. 

27. 习题19中的线性变换. 

28. 习题14中的线性变换. 

习题 29 〜30中，使用 1.2 节例1的符号给出 
线性变换 T 的标准矩阵可能的阶梯形. 

29. r : R 3 -» R 4 是一对一的. 

30. r : R 4 -» R 3 是满射. 

31. 设 r : ir -> iir 为线性变换， a 为它的标准矩 

阵，完成下面的 命题： “ r 是一对一的当且仅 
当 a 有_个主元列”.说明该命题为何 


是真的.（提示 ：参看 1.7 节的习题 .） 

32. 设 r : ir -» iir 为线性变换， a 为它的标准矩 
阵，完成下列 命题： “7'把》"映上到》'当且 
仅当 A 有 个主元列”.根据哪些定理 


可以确定此命题为真？ 

33. 证明定理10中 a 的惟一性，设 r : Er -> ir 为 
线性变换，对某个 mxn 矩阵 S ， 有 r ( x ) = ftr ， 
证明若 A 是 r 的标准矩阵，则4 = 5.( 提示： 
证明 A 和 S 有相同的列 .） 

34. 问题“线性变换 r 是否满射？”为什么就是存 
在性问题？ 

35. 若线性变换 r : R" IT 把 R" 映射到 IT 上，你 
能否给出 m 和 n 之间的一个关系？ 若 T 是一 
对一的，你能否给出 m 和 n 之间的关系？ 

36. 设5:1{ ;) ->1{"，7' : »"->1{"都是线性变换.证 
明映射 xi^r(S(x)) 是(从 IT 到 R m 的)线性映 
射.（提示：计算7'(5(<:« +办))，《^属于11^, 
c，d 为数. 给出每一步计算的理由，说明为何 
这一计算给出所需的结论 .） 


[ M ] 习题37 ~ 40中，设 T 是标准矩阵已给的 
线性变换，在习题37~38中，判断 T 是否一对一 
映射，在习题39 ~ 40中，判断 T 是否把 R 5 映上到 
R 5 ，给出理由. 
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练习 题答案 

看看《，和6变成什么.见图 1-46. 首先， e , 不受剪切变换的影响，而后它被对称变换变为所以 
7(^) = ^,.其次， e 2 被剪切变换变为 e 2 -0. se , ， 因关于^轴的对称变换把变为4,,£ 2 不变，所以向量 
-0.5^, 变为 e 2 +0.5 e ,, 所以 T ( e 2 ) = e 2 +0.5 e , ,于是7的标准矩阵为 

[ r ( ei ) r ( e 2 )] = [-«| e 2 载] 4一1 ? 5 1 



1.10 经济学、科学和工程中的线性模型 


本节中的数学模型是线性的，也就是说，借助线性方程（通常利用向量或矩阵形式）来描 
述一个问题，第一个模型讨论营养，实际上代表线性规划问题的一般技术.第二个模型来自电 
学. 第三个模型引进线 性差分方程的 概念，此概念是研究动力系统的有力工具，在工程、生态 
学、通信和管理科学中都有广泛 应用. 线性模型的重要性在于当涉及的变量被保持在合理的范 
围时，自然现象通常是线性或接近线 性的. 同时，线性模型比复杂的非线性模型更容易使用计 
算机来 处理. 在阅读每一个模型时，注意线性模型如何体现所研究问题的相关性质. 

构造有营养的减肥食谱 

一种在20世纪80年代很流行的食谱，称为剑桥食谱，是经过多年研究编制出来的.这是 
由 Alan H . Howard 博士领导的科学家团队经过8年对过度肥胖病人的临床研究 6 ,在剑桥大学 
完 成的. 这种低热量的粉状食品精确地平衡了碳水化合物、髙质量的蛋白质和脂肪、配合维生 
素、矿物质、微量元素和电解质.近年来，数百万人应用这一食谱实现了快速和有效的减肥 • 
为得到所希望的数量和比例的营养， Howard 博士在食谱中加人了多种 食品. 每种食品供应 
了多种所需要的成分，然而没有按正确的比例.例如，脱脂牛奶是蛋白质的主要来源但包含过 
多的钙，因此大豆粉用来作为蛋白质的来源，它包含较少量的钙.然而，大豆粉包含过多的脂 
肪，因而加上乳清，因它含脂肪较少.然而乳清又含有过多的碳水化合物…… 


© 这种迅速减肥的方法首先发表在 International Journal of Obesity ( 1978) 2, 321-332. 





_ …章 

下例说明这个问题小规模的情形.表 1-6 是该食谱中的3种食物以及100克每种食物成分 
含有某些营养素的数量. 0 


表 1-6 


营养素（克） 

每100克成分所含营养素 

剑桥食谱每天供应量（克） 

脱脂牛奶 大豆粉 乳清 

蛋白质 

36 51 13 

33 

碳水化合物 

52 34 74 

45 

脂肪 

0 7 1.1 

3 


例1求出脱脂牛奶、大豆粉和乳清的某种组合，使该食谱每天能供给表 1-6 中规定的蛋 
白质、碳水化合物和脂肪的含量. 

解设和; c 3 分别表示这些食物的数量（以100克为单位）.导出方程的一种方法是对 
每种营养素分别列出方程.例如，乘积 

U 单位的脱脂牛奶}{每单位脱脂牛奶所含蛋白质 } 

给出;^单位脱脂牛奶供给的蛋白质.类似地加上大豆粉和乳清所含蛋白质，就应该等于我 
们所需的蛋白质.类似的计算对每种成分都可进行. 

更有效的方法（概念上更为简单）是考虑每种食物的“营养素向量”而建立向量方程. x ，单 
位的脱脂牛奶供给的营养素是下列标量 乘法： 

标量 向量 

单位的1 /每单位脱脂1 

1 脱脂 牛奶丄 1牛奶的营养素 J Xl ° l (1) 

这里 a , 是表 1-6 的第一列，设^和^分别为大豆粉和乳清的对应向量，6为表示所需要的营养 
素总量的向量（表中最后一列）.则 i 2 a 2 和; c 3 fl 3 分别给出由;^单位大豆粉和;^单位乳清给出的 
营养素，所以所需的方程为 


把对应的方程组的增广矩阵行变换得 


"36 

51 

13 

33' 


"1 0 0 0.277" 

52 

34 

74 

45 


0 1 0 0.392 

0 

7 

1.1 

3J 


0 0 1 0.233 


精确到3位小数，该食谱需要 0.277 单位脱脂牛奶、 0.392 单位大豆粉、 0.233 单位乳清， 
这样就可供给所需要的蛋白质、碳水化合物与脂肪. ■ 

重要的是，求出的; c ,, A 和; c 3 的值是非负的，这使求出的解有实际意义.（你如何用 -0.233 
单位乳清？）由于对许多营养素都有要求，可能使用多种食物，以得到有“非负解”的方程组. 
因而为了得到这样的解，需要观察各种方程，事实上，剑桥食谱的制造者应用了 33种食物来供 


© 1984年食谱中的 成分； 食物成分中的营养素取自 USDA 农业手册， No.8-1 和 8-6, 1976. 
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给31种营养素. 

由食谱构造问题产生线 性方程 （2)，因为由食物供给的营养素可写成一个向量的数量倍， 
如 （1) 式 所示. 即某种食物供给的营养素与加人到食谱中的此种食物的数量成比例，同时，混 
合物中的营养素是各种食物中营养素之和. 

设计某种特殊的人类或牲畜的食谱问题是经常遇到的，我们构造向量方程的方法常常可以 
使这些问题的求解得到简化. 

线性方程与电路网络 

电路网络中的电流可由线性方程组描述.电源，例如电池，促使电荷在网络中流动.当电 
流通过电阻（例如灯泡、电动机等），一部分电压被“用 掉”； 由欧姆定律，这种“电压降”等 
于 


V = RI 

这里 V 以伏特量度，电阻以欧姆量度（用 O 表示），电流/用安培表示（简写为 amps ). 
图 1-47 中的网络包含3条闭通路，在回路1，2, 3中流过的电流分别用/,,/ 2 和/ 3 表示.回 
路电流 的指定方向是任意取定的，若某一电流求出来是负值，表示实际电流方向与图所选择的 
方向相反，若所示的电流方向是由电池(彳 I -) 的正极（长边）指向负极（短边），电压为正，否 
则电压为负. 



r n G r n 



图 1-47 


回路中电流服从下列定律. 

基尔霍夫电压定律 

围绕一条回路同一方向的电压降尺/的代数和等于围绕该回路的同一方向电动势的代数和. 
例 2确定图 1-47 中网络中的回路电流. 

解 对回路1,电流/,通过3个电阻，总电压降 

4/,+4/,+3/, =(4 + 4 + 3)/, =11/, 
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回路2的电流流过回路1的一部分，即 A 与 B 之间的短分支，对应的尺/电压降为3/ 2 伏特， 
然而，回路1中分支之间的电流方向与回路 2 中该分支的电流方向相反，因此回路1中总 
的尺/电压降为11/,-3/ 2 .因回路1中的电动势为+30伏特，基尔霍夫电压定律给出 
11/,-3/ 2 =30 

对回路2,方程为 

-3/,+6/ 2 -/ 3 =5 

项 -3/, 来自回路1通过分支 ( 电流方向与回路2的电流方向相反）的电流，项6/ 2 是回 
路2中所有电阻的和乘以回路电流.项-/ 3 =-1./ 3 是由回路3的电流通过 CD 分支1欧姆电阻引 
起的，与回路2电流方向相反.冋路3的方程为 

-/ 2 +3/ 3 =-25 

注意分支 CD 上的5伏特电池同时属于回路2与回路3,但对回路3,它是 -5 伏特，因它的 
方向与回路3所选择的方向相反. 

所以这些电流可由解下列方程组得出 

11/,-3/ 2 =30 

-3/,+6/ 2 - / 3 = 5 (3) 

- 7 2 +3/ 3 =-25 

对增广矩阵作行变换的解为/,= 3安培，/ 2 =1安培，/ 3 =-8安培，/ 3 的负值表示回路3的 
实际方向与图 1-47 中所示相反. 

把方程组 （3) 看作向量方程是有启发 性的： 

"11] [-3] I " 0] 「30 

h -3 +/ 2 6 + / 3 -1 = 5 

0」 [-1 J 3」 [-25 

个 t 个个 （4) 


每个向量的第一个元素是在第一个回路中的电阻，类似地第二个、第三个元素分别是在第 
二、 第三个回路中的电阻.第一个电阻向量列出各个回路中电流 A 流过的电阻.当/,流过该 
电阻的方向与另一回路方向相反时，该电阻取负号.观察图 1-47, 看看如何写出 r , 中的 元素； 
然后同样写出 r 2 和 ;V (4) 的矩阵形式， 

尺 i = v , 其中尺 = [ r , r 2 r 3 ], i = I 2 
h 

给出欧姆定律的矩阵形式.若所有回路电流都选取同一方向，则尺的非主对角线元素全部都是 
负值 • 

矩阵方程 W = v ，表明这个模型的线性，例如，若电动势向量加倍，则电流向量也 加倍； 同 
时，叠加原理也成立.即方程 （4) 的解是下列方程的解的和 
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"30] roi r o' 

Ri= 0 ， Ri= 5 , Ri= 0 
_0 」 |_0 」 |_-25_ 

这三个方程中的每一个对应回路仅包含一个电动势的网络 （ 其他电源代以封闭该回路的导 
线）. 电流模型是线性的，这是因为欧姆定律与基尔霍夫定律都是线 性的； 通过某一电阻的电 
压降与通过它的电流成正比 （ 欧姆定律），而回路中的电压降的和等于回路中电动势的和 （ 基尔 
霍夫定律）. 

网络中回路电流可以决定电路中每一个分支通过的 电流. 若仅有一回路电流通过该分支， 
如图 1-47 中从 B 到 D 的分支，则通过该分支的电流等于回路 电流. 若有多个回路电流通过该分 
支，如从 A 到 B 的分支，则通过该分支的电流是各回路电流的代数和（基尔霍夫电流 定律） .例 
如，通过分支的电流为/,-/ 2 =3-1 = 2安培，方向与/,相同，分支 CD 中的电流为/ 2+ / 3 =9 
安培. 

差分方程 

在生态学、经济学和工程技术等领域中，需要研究随时间变化的动力系统，这种系统通常 
在离散的时刻测量，得到一个向量序列 和，; 向量; C * 的各个元素给出该系统在第 jt 次测 
量中的状态的信息. 

如果有矩阵 A 使 A = Ax 0 ,x 2 = Ax , ，一般地， 

Af t+1 = Ax k , k = Q , l ,2, ■■- (5) 

则 （5) 式称为 线性差分方程 （或 递归关 系）. 给定这样一种关系，我们可由已知的； 计算; 

等等 .4.8 节与 4.9 节以及第5章的若干节，将推导 求心的 公式，并确定 it 无限增大时心的变化 
情况•下列的讨论说明导致差分方程问题产生的原因. 

地理学家对人口的迁移很有兴趣.这里我们考虑人口在某一城市与它的周边地区之间迁移 
的简单模型. 

固定一个初始年，例如说，2000年，用和 s 。 分别表示该年城市和郊区的人口数.令太。表 
示人口向量 

2000年城市人 □ 

^ L^oJ 2000年郊区人 □ 

对2001年与以后各年，把人口向量表示为 



我们的目的是在数学上表示出这些向量的关系. 

设人口统计学的研究说明每年约有5%的城市人口移居郊区（其他95%留在城市），而3% 
的郊区人口移居城市（其他97%留在郊区）.见图 1-48. 



86 


第 1 幸 



图 1-48 每年城市与郊区迁移的百分比 


—年后.原来城市中的人口 r 。 在城市和郊区的分布为 


'0.95 r 0 l _ |"0.95"| 留在城市 

0.05 r 0 J _ r 0 [ o .05 j 迁到郊区 


郊区2000年的人口 & 一年后的分配为 


「 0.031 

5 °[ o .97 


移到城市 
留在郊区 


向量 （ 6 > 和 （ 7 ) 组成2001年的全部人口 ‘，因为 


即 


>,]_ [0.95] [0.03] [0.95 0.03] k' 

5,J = ro [o.05j +5o [o.97j = [o.05 0.97J [s 0 . 


(6) 


(7) 


Jfi — Mxq ( 8 ) 

这里 A / 是移民矩阵，由下表 确定： 

由 ：城市 郊区移至： 

「0.95 0.03] ttcm 
[o.05 0.97J 

方程 （8) 表示人口由 2000 年到 2001 年的变化.若移民比例保持常数，则由2000年到2001 
年的改变为 


X2 — MXi 

由2002年到2003年以及以后的各年的变化都是类似的.一般地 

x k ^=Mx k , fc = 0,l,2,--- (9) 

向量序列 Uaa ,...} 描述了若干年中城市、郊区人口变化的状况. 

例3设2000年城市人口为600 000,郊区人口为400 000人，求上述区域2001年和2002 
年的人口. 


© 为简单起见.我们忽略出生、死亡、移民等对城市.郊区人口的影响. 
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解 


2000年的人口为 


x 0 


「600 000] 
|_400 000」’ 
_|"0.95 0.03 
~ I 0.05 0.97 


对2001年， 


" |"600 000]_["582 000" 
|_400 000」_1_418 000_ 


对2002年， 

_ _[0.95 0.03] [582 000] _ [565 440] 

x 2 = Mr , =|^ oo5 Q97 J |^41 8 000] _ [434 560 J 

式 （9) 的人口迁移模型是线性的，因为对应^ 4 x t +1 是线性 变换. 这依赖于两个事 实：从 
一个地区迁往另一个地区的人口与该地区原有的人口成正比，如 （6) 式和 （7) 式所示，而这 
些人口迁移选择的累积效果是不同区域的人口迁移的叠加. 


练习题 

求出矩阵 A 以及向量 x 和使例1中的问题成为解方程 Ac 


习题 1.10 


1. 一种早餐麦片的包装罐通常列出每份食用量包 
含的卡路里、蛋白质、碳水化合物与脂肪的量. 
两种常见的麦片的营养素含量如下表. 


营养素 

每份食物营养素含量 

General Mills Cheerios 

Quaker 100%天然麦片 

卡路里 

110 

130 

蛋内质 

(克） 

4 

3 

碳水化 



合物 

20 

18 

(克） 



脂肪 

(克） 

2 

5 


设这两种麦片的混合物要求含热量295卡路 
里，9克蛋白质，48克碳水化合物和8克脂肪. 

a . 建立这个问题的一个向量方程，并给岀方程 
中变量表示的含义. 

b . 写出等价的矩阵方程，并判断所希望的两种 
麦片的混合物是否可以制作出来. 

2. •份 （ 28克） Kellogg 脆燕麦片含有110卡路里 
热量，3克脂肪.一份 Kellogg 脆片含有110卡 


路里热量、2克蛋白质、25克碳水化合物、 0.4 
克脂肪. 

a . 列出矩阵 S 及向量 u , 使 Su 给出3份脆燕 
麦片和2份脆片所含热量、蛋白质、碳水化 
合物与脂肪的量. 

b . [ M ] 设你希望一种麦片含蛋白质多于脆片但 
含脂肪少于脆燕麦片.是否可能混合两种 
麦片，使它含有110卡路里热量、 2.25 克蛋 
白质、24克碳水化合物、1克脂肪？如果可 
能的话，如何混合？ 

3. 剑桥食谱除例1中列出的营养素外，每天还供 
给 0.8 克钙.在剑桥食谱中的三种食物，每单位 
( 100克）供给的 钙为： 脱脂牛奶 1.26 克、大豆 
粉 0.19 克、乳清 0.8 克，该食谱中的另一种成 
分是大豆蛋白质，它每单位供给的营养 素为： 
80克蛋白质、0克碳水化合物、 3.4 克脂肪和 
0.18 克钙. 

a . 列出矩阵方程，它的解确定脱脂牛奶、大豆 
粉、乳清与大豆蛋白质的量，使这种混合物 
正好含剑桥食谱中所需各种营养素的量. 
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叙述方程中各个变量表示的含义. 6. 

b . [ M ] 解 U ) 中所得方程，讨论你的答案. 

4. 一位营养学家计划设计一种食谱，这种食谱供 
给一定量的维生素 C 、 钙与镁.三种食物将被 
使用，它们的量用适当单位计算.这些食物所 
供给的营养素和该食谱要求的营养素列表如 
下. 

单位食物所含营养素 
(毫克） 



in 


30 
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9. 在某区域中，每年有大约5%的城市人口迁往郊 
区，大约4%的郊区人口迁往城市 • 2000年，有 
600 000人居住在城市,3400 000人居住在郊区 • 
列出差分方程描述这些情况，以 X 。表示2000年 
的初始人口，然后估计2002年居住在城市和郊 
区的人口（忽略影响居民人口的其他因素）. 

10. 在某区域中，每年大约有7%的城市人口迁移 
郊区而3%的郊区居民迁往城市.在2000年. 
城市有800 000居民，郊区有500 000居民•列 
出差分方程描述这些情况，其中是2000年 
初始人口.估计两年后即2002年居住在城市 
和郊区的人口. 

11. 在1990年初.加利福尼亚的人口为29 716 000 
人，居住在美国其他各州的人口为218 994 000 
人.该年有509 500人由加利福尼亚迁出该州， 
而564 100人从美国其他地区迁往加利福尼 
亚 . e 

a . 建立该问题的移民矩阵,精确到5位有效数字. 

b . [ M ] 计算2000年加利福尼亚和美国其他地区的 
预计人口数，假设迁移率在10年内不会改变. 
(不考虑出生、死亡或美国之外的移民 .） 

12. [ M ] 堪萨斯州 Wichita 市的 Budget Rent A Car 
公司有一个车队共450辆车,分布在3个地点 • 
在一个地点租的车可以在3个地点的任何一个 
交还.这些车归还的比例在下表中 列出. 设星 
期一有304辆车在机场出租，48辆车在东区出 
租，98辆车在西区出租，星期三这些车将会在 
三个地点如何分配？ 


从出 租地: 


机场东区西区 
0.97 0.05 0.10" 
0.00 0.90 0.05 
0.03 0.05 0.85 


归 还到： 
机场 
东区 
西区 


13. [ M ] 设 M 与 JC 。 如例 3. 

a . 计算人口向量 x t ,Jk = l ,2,--.,20, 你发现了什 


么规律？ 

b . 对初始人口为城市350 000人，郊区650 000 
人重复 （ a )， 你发现了什么规律？ 

14. [ M ] 研究钢板上边界的温度变化如何影响钢板 

内部区域的温度. 

a . 首先，估计图中钢板的4个点处的温度 
T u T 2 , T „ T 4 , T k 的偉等于最靠近它的 4 个点 
处温度的平均值.参阅 1.1 节的习题33和 
34,在那里求得相应的温度值为 （ 20, 27.5, 
30, 22.5 )( 以度为单位），这些数据和你在 
图 3 和1)中求出的值有什么关系？ 

b . 不做计算，猜想在 （ a ) 中边界温度都乘以 
3时钢板内部4个点的温度？检验你的猜 
想. 

c . 最后，猜想边界上8个温度与内部4个点 
的温度的相应关系. 


20。20。 0。 0° 



a ) 


b ) 


练习题答案 



36 

51 

13 


V 


33" 

A = 

52 

34 

74 

, x = 

X 2 

，办 = 

45 


0 

7 

1.1 




_ 3 


© 由加利福尼亚财政部地理研究所提供的移民数据. 
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第 1 章补充习题 

1. 标出每个命题的真假，给出理由 .（ 若是真的， 

举出适当的事实或定理，若是假的，说明原因 

或举出反例 .） 

a . 每个矩阵行等价于惟一的阶梯形矩阵. 

b . 含有 n 个未知数的 n 个方程至多有 n 个解. 

c . 若线性方程组有两个不同的解，则它必有无 
穷多个解. 

d . 若线性方程组没有自由变董，则它有惟一解. 

e . 若增广矩阵 [4 A ] 由初等行变换变为 [C </], 
则方程 Ax = bgCx = d 有相同解集. 

f . 若方程组 At = A 有多 于一^ f , 则 Ac = 0也是. 

g . 若 A 是 mxn 矩阵，且对某个 A , 方程 Ac =* 
相容，则 A 的各列生成 IT . 

h . 若增广矩阵 U A ] 可由初等行变换化为简化 
阶梯形，则方程 Ar =6相容. 

i . 若矩阵 A 和 fi 行等价，则它们有相同的简化 
阶梯形. 

j . 方程 Ac = 0 有平凡解当且仅当它没有自由变量. 

k . 若4是 mxn 矩阵，方程 Ar = ASR "中任意 
办都相容，则4必有 m 个主元列. 

l. 若矩阵 A 在每一行都有一个主元位置， 
则对 K " 中任意方程 Ar = A 有惟一解. 

m . 若矩阵4有„个主元位置，则 A 的简 
化阶梯形是单位矩阵. 

n - 若 3 x 3 矩阵 A 和 fi 都有3个主元位置，则通 
过初等行变换可以将 A 变换为 B . 

o . 若4是 mxn 矩阵，方程 Ac = A 有至少两个不 
同的解，如果方程 Ac = c 相容，则方程 Ar=c 
有多个解. 

P . 若4和 S 是行等价的 mx n 矩阵，且>1的列 
生成 1 T , 则的列也生成 R ". 

q . 若炉中向量集 S = 〖!；,，中任意一个向置 
都不是其他向量的倍数，则 S 线性无关. 

r . 若 (《, v , h >} ^性无关集，则“, v 和 w 不在 R 2 中. 


s . 在某些情况下，4个向量可能生成 R 5 . 

t . « 和 v 属于 R ", 则 -H 属于 Span { n , v }. 

U . 若 《, v 和1^是]» 2 中的非零向量，则《是《和 V 
的线性组合. 

V. 若 w 是] r 中《和 *> 的线性组合，则 
的线性组合. 

W . 设 v ,， v 2 , v , 是] R 5 中非零向量， h 不是 V ,的倍 
数， V ,不是〃，和〜的线性组合，则 { V| , V2 , V3 } 线 
性无关. 

X. 线性变换是函数. 

y . 若 A 是 6 x 5 矩阵，线性变换 Ac 不能将 
R 5 映上到 R 6 . 

z . 若 A 是有 m 个主元列的 mx n 矩阵,则线性变 
换 jtH At 是一对一映射. 

2. 设和办表示实数.叙述（线性）方程似=«>的解集 

的各种可能情况.（提 示： 解的数目依赖于和 fc •) 

3. —个线性方程 o *+ 办+ « = </的解 ( jc ， y , z ) 可以表 

示为 R 3 中的一^平面，其中不全为零.构造 

有三个方程的方程组表示图 a 相交于一条直线， 

b 相交于一点， c 没有交点.图形如下所示. 



a) 三个平面交于一条直线 b) 三个平面交于一点 


C) 三个平面没有交点 C*) 三个平面没有交点 
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4. 三个未知量三个方程的线性方程组的系数矩阵 
的每一列都有一个主元位置，说明方程组为什 
么有惟一解. 

5. 确定 A 和的值，使下列方程组的解集 （ i ) 是 
空集， （ ii ) 包含惟一的解， （ iii ) 包含无穷多个 



解. 

a . x , +3 x 2 -k b . -2 x , + hx 2 =l 
4 x , +/ tc 2 =8 6 x t + kx 2 =-2 

6 . 确定下列方程组是否 相容： 

- 2; c 2 + 7; c 3 = -5 
84 — 3又2 +1 OJC3 = —3 

a . 定义适当的向量，把问题重述为线性组合的 
形式，再解此问题. 

b . 定义适当的矩阵，用的列”重述此问题. 

c . 定义适当的线性变换 r , 利用 （ b ) 中矩阵， 
用 r 的术语重述此问题. 

7. 考虑下列的问题，确定方程组是否对任意的 
bi ， b 2， b } 相容. 

2 x , -4 x 2 -2 x 3 =bt 
-5 a + x 2 + x 3 = b 2 
lx { -5 x 2 -3 x ^=1^ 

a . 定义适当的向量，用 Span { Vl , v 2 ， i > 3 } 的术语重 
述问题，然后解此问题. 

b . 定义适当的矩阵用“/4的列”重述问题. 

c . 用 （ b ) 中矩阵定义适当的线性变换 r ， 用 r 
的术语重述问题. 

8 . 使用 1 . 2 节例 1 的记号描述矩阵/ 4 可能的阶梯 
形. 

a . A 是 2 x 3 矩阵，其列生成 M 2 . 

b . A 是 3 x 3 矩阵，其列生成 M 3 . 

9. 将向量表示为两个向量的和，其中一个在直 
线 { U , 30 7 = 2 幻上，另一个在直线 {( u ):= 

又/2}上. 

10 . 设< 1 ,，< 1 2 和 6 是 R 2 中的向量，如下图所示， 

A = [ a , a 2 ]. 方程如= 6 是否有解？如果有 
解，解是否惟一？给出解释. 


11. 构造一个 2 x 3 矩阵不是阶梯形，使得 
&=0的解是 R 3 中的一条直线. 

12. 构造一个 2 x 3 矩阵不是阶梯形，使得 
& = 0的解是 R 3 中的一个平面. 

13. 写出一个 3 x 3 矩阵4的阶梯形，使得/4的首 


14. 



" 3 


" O ' 

两列是主元列，且/4 

-2 

=: 

0 


1 


0 


求°_得 BUI 


是线性无关集. 


15. 设 （ a ) 和 （ b) 中的向量线性无关，数 

有何特征？给出理由.（提 示： 对 （ b ) 使用一 
个定理 .） 


a b d 

a. 0 f c , e b. 

_oJ [oj [f 


16 .使用 1.7 节定理 7 解释为什么矩阵 4 的列线性 



无关. 


A = 


"1 0 0 0 ' 

2 5 0 0 

3 6 8 0 
.4 7 9 10 


17. 说明为什么 R 5 中的向量集 { Vl , v 2 , V3 , V4 } —定是 
线性无关的，其中 { v t > v 2) v 3 } 线性无关，且 v 4 不 
属于 Span { vi , v 2 ， v 3 }. 

18. 设 { v ,，!^} 是 R " 中的线性无关向量集，证明 
{ vi ， v , + v 2 } 也线性无关. 

19. 设是 R 3 中一条直线上的三个不同点， 
这条直线不一定经过原点，证明 { Vl ， v 2 ， v 3 } 线性 
相关. 


20. 设是线性变换， T ( u ) = v ,证明 
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T(-u) = -v . 

21. 设 LR 3 4 R 3 为线性变换，把每个向量变为它 
关于平面; c 2 =0 的对称点，即 rUAAXA , 
- x 2 ,^ 3 ) ,求出变换 r 的标准矩阵. 

22. 设/4是 3 x 3 矩阵，线性变换 Ac 把 K 3 映 
上到 R 3 , 说明为什么这个变换是一对一的. 
(提 示： 考虑主元位置 .） 

23. 吉温斯旋转是由 R" — K" 的一种线性变换，在 
计箅机程序里用来在一个向量中产生一个零元 
素 （ 通常是矩阵的一列） . R 2 中的一个吉温 
斯旋转 （ 见图 1-49) 的标准矩阵有形式 


求出 <>与/»把^旋转到 Z . 



24. 下列方程是 R 3 中的吉温斯旋转，求出 a 和心 


a 0 -b 

'2 


' iS ' 


0 1 0 

3 

= 

3 

， a 2 -\- b 2 = 

b 0 a 

4_ 


0 



25. 一幢大的公寓建筑使用模块建筑 技术. 每层 
楼的建筑设计由3种设计中选择. A 设计每层 
有18个公寓，包括3个三室单元、7个两室 
单元和8个一室 单元； B 设计每层有4个三室 
单元、4个两室单元和8个一室 单元； C 设计 
每层有5个三室单元、3个两室单元和9个一 
室单元.设该建筑有; t , 层采取 A 设计，心层采 
取 B 设计， a 层采取 C 设计. 

_3_ 

a . 向量; t , 7的实际意义是什么？ 

8 

b . 写出向量的线性组合表示该建筑所包含的三 
室、两室和一室单元的总数. 

c . [ M ] 是否可能设计该建筑物，使恰有66个三 
室单元、74个两室单元和136个一室单元？若 


图 1-49 R 2 中的吉温斯旋转 


可能的话，是否有多种方法？说明你的答案. 
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介绍性实例飞机设计中的计算机模型 


为了设计下一代的商业和军用飞机，波音的幻 
影 T 作室的工程师们使用三维建模和计算流体动力 
学.他们在建造实际的模型之前，研究一个虚拟的模 
型周围的空气流动，这样做可以很大程度地缩短设 
计周期，降低成本，而线性代数在这个过程中起了 
关键的作用. 

虚拟的飞机模型的设计从数学的线形轮廓模型 
开始.它存储在计算机内存中，并可显示在圈形显 
示终端 .（ 图示给出波音777的模型 .） 这个数学模 
S 组织和影响设计和制造飞机外部和内部的每一个 
过程.计算流体动力学分析主要考虑的是飞机外部 
表层的设计. 

虽然飞机精巧的外表看上去是光滑的，但其表 
面的几何曲面是十分复杂的.除了机翼和机身，飞机 
上还有引擎机舱、水平尾翼、狭板'襟翼、副翼.空气在这些结构上的流动决定了飞机在天空中如何运动. 
描述气流的方程很复杂，它们必须考虑到引擎的吸气量、引擎的排气董和机翼留下的 尾迹. 为了研究气流， 
工程师们需要飞机表面的精确描述. 

用计算机建立飞机外表的模型.首先在原来的线形轮廓模型上添加三维的立方体格子.这些立方体有 
的处于飞机的内部，有的在外部.有的和飞机的表面相交.计算机选出这些相交的立方体，并进一步细分. 
保留仍然和飞机表面相交的立 方体. 这种细分过程一直进行下去，直到立方体非常精细. 一 个典型的网格 
可以含有超过400 000个的立方体. 

研究飞机表面的气流的过程包含反复求解大型的线性方程组办=6,涉及的方程和变量个数达到 2 
百万个.向量6随来自网格的数据和前面的方程的解而改变.利用现在商业上买得到的最快的计算机.幻 
影工作组求解一个气流问题要用数小时至数天的 时间. 工作组分析方程组的解之后，会对飞机的外表进行 
稍微的修改，整个过程又再重新开始，计算流体动力学的分析有可能要进行数千遍. 

本章给出协助求解这样大规模方程组的两个重要的概念： 

• 分块 矩阵： 一个典型的计算流体动力学的方程组会有“稀疏”的系数矩阵，上面有许多零元素.将 
变量正确地分组会产生有许多零方块的分块矩阵 .2.4 节介绍了这种矩阵及其应用. 
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• 矩阵 分解： 即使使用分块矩阵，这样的方程组还是相当的复杂.为了进一步简化计算，波音的计 
算流体动力学软件使用了对系数矩阵进行 if / 分解的方法 .2.5 节将讨论 it / 和其他有用的矩阵分解. 
关于分解的更详细的内容在本书后面出现. 

为了分析气流问题的解，工程师们希望将飞机表面的气流显示出来.他们利用计算机图形以及线性代 
数作为图形的引擎.飞机外表的线形轮廓模型作为许多矩阵数据存储.图像在计算机屏幕上染色显示后. 
工程师们可以改变图像的大小.对局部区域进行缩放.以及对图像旋转以看到在视图中被隐藏的部位.这 
里的每个操作是通过适当的矩阵乘法运算来实现的. 2.7 节解释了其中的基本思想.图 2-1 为波音公司为机 
翼做设计. 


W 



图 2-1 现代计算流体动力学给机翼的设计带来了革新.波音公司 

正在为2020年或更早的混合机翼和机身的新飞机做设计 >>>>>>>> 

当我们学会矩阵的代数运算后，我们分析和解方程的能力将会大大提髙.本章中的定义和 
定理给 出一些 基本的 T： 具来处理涉及两个或更多个矩阵的线性代数问题.对方阵而言， 2.3 节的 
逆矩阵定理把许多以前学过的概念联系在一起 • 2.4 节与 2.5 节研究分块矩阵以及矩阵的分解， 
它们在线性代数的应用很广. 2.6 节和 2.7 节给出了矩阵代数在经济学、计算机图形学中的两个 
有趣应用. 

2.1 矩阵运算 

若 A 是 /nxn 矩阵，即有 m 行„列的矩阵，/1的第 f 行第） 列的元素用叫表示，称为的 (U) 
元素，见图 2-2. 例如， （ 3,2 ) 元素是在第3行第2列的数 fl32 , A 的各列是 R m 的向量用 （ 黑体 
字母），…，<!„表示.当我们特别注意/I的各列时，我们写成 = <| 2 …<!„]，注意叫是第/ 
个列向*屮（从上面算起）的第/个元素. 

/1 = [%]的对角线元素是印 1 ，^ 22 ,^33，".,它们组成/1的主对角线.对角矩阵是一个方阵，它的 
非对角线元素全是 0. 元素全是零的 mx/i 矩阵称为零矩阵，用0表示，0的维数通常可由上下 
文知道，否则我们就用 0„ x „ 表示. 
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图 2-2 矩阵记号 


和与标量乘法 


前面叙述过的向量运算可以自然地推广到矩阵.我们称两个矩阵相等，若它们有相同的维 
数（即有相同行数和列数），而且对应元素相等.若/ I 与 B 都是 mxn 矩阵，则和 /l + fl 也是 mxn 
矩阵.它的各列是 A 与 B 对应列之和，因列的向量加法是对应元素相加 ， A + fi 的每个元素也就 
是 A 与 B 的对应元素相加.仅当/ I 与 B 有相同维数， 4 + fl 才有定义. 


例1设 


则 


4 0 
-13 2 


1 „ n 1 n 
PH 〗 5 7 J 


'5 L 6' 
[2 8 9 



但 A + C 没有定义，因 4 与 C 的维数不同. ■ 

若 r 是标量而4是矩阵，则标量乘法 M 是一个矩阵，它的每一列是/ I 的对应列的 r 倍.与 
向量相同，定义-/ I 为 (-1 M 而 A - B 为 /l + (- l ) B . 

例2设/ I 与 fl 如例1,则 



在例2中，计算 /1-2 B 时，不必化为 A + 因为通常的代数法则对矩阵的和与标量乘 


法仍适用，如下列定理所示. 


定理1设 Afl , C 是相同维数的矩阵， f •与 s 为数，则有 
a . A + B = B + A b . (A + B)+C = A + ( B + C ) 

c . /\ + 0 = >l d . r(A + B ) = rA + rB 

e . ( r + s)A = rA-\-sA f . r ( sA ) = ( rs)A 

为证明定理 i 的各个等式，只要证明左端矩阵和右端矩阵有相同维数且对应各列相等.维 
数是无问题的 .因 的维数相同.而由向置的类似性质，立即知道两端的对应各列相等.例 
如， 若 的第）列分别是 a j〆 ,， 则 (/ l + fl)+C 与 A +( fl + C ) 的第 j 列分 别是 
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(a, +沁)+~ 与 +(bj +Cj) 

因对每个入这两个向量相等，这就证明了 （ b ). 

由于加法的结合律，我们只要写 Z + fl + C 即可，它无论按 ( A + B )+ C 或 A + ( fl + C ) 计算都得 
同一结果.同样对四个或更多矩阵也可定义加法. 

矩阵乘法 

当把矩阵 fl 乘以向量它将 x 变换为向量 to . 若这向量又乘以矩阵/ I ，结果得向量小份）， 
见图 2-3. 




图 2-3 先乘以 B 再乘以4 


于是小&:)是由 x 经复合映射变换所得，此映射是 1.7 节所研究的线性变换.我们的目的是将此 
复合映射表示为乘以一个矩阵的变换，此矩阵记为 4 B ， 即 


见图 2-4. 


A ( Bx ) = ( AB)x 



图 2-4 乘以 


若 A 是 mxn 矩阵， fl 是 nxp 矩阵， jr 属于 IT . 用私,…，表示的各列，而 x 的元素为 
A ， …，,则 

Bx = x l b l +--+x„b p 

由于乘以的线性性质 

MBx) = Aixjby )+••_+ A(xjb p ) = x./li, +—+x p Ab p 

向量 / l ( fix ) 是向量>^，…的线性组合，以 x 的元素为权，若我们把这些向量表示成一个矩 
阵的各列，就有 

A(Bx)=\_Ab, Ab 2 ■•- Ab„^x 

于是乘以矩阵 [你他… 叫]把 x 变为 A ( flr ), 我们已经找到了所需要的 矩阵. 

定义若 >4是 mxn 矩阵， fl 是 nxp 矩阵， B 的列是 ，…， b p ， 则乘积 Afl 是 /nxp 矩阵，它 
的各列是 /VA ,， …，即 
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AB = A[*i b 2 ■■- b p ~\ = [Abi Ab 2 ■■- Ab p ~\ 


这个定义使 （1 ) 式对中所有 jc 成立，方程 （ 1 ) 证明图 2-4 中的复合映射是线性变换， 


它的标准矩阵是 AB ， 矩阵乘法对应线性变换的复合. 
例3 计算 AB ， 其中4 = ^ = _l 3 

解 写5 = [6, 6 3 ], 计算 


因此 



AB = A[6, 



Ab\ A^2 ^^3 

注意，由 AB 的定义，它的第一列 A 6, 是 A 的各列用6,的各元素为权的线性组合.其他各列 
也是这样. 

I AB 的每一列都是 A 的各列的线性组合，以 B 的对应列的元素为权 . 


显然， A 的列数必须等于 B 的行数，才能使线性组合 Aft , 有定义，由定义知，的行数等 
于 A 的行数，列数等于 B 的列数. 

例4若 A 是 3 x 5 矩阵， B 是 5 x 2 矩阵，和 BA 是否有定义？若有定义，是什么矩阵？ 
解因 A 有5列， B 有5行，乘积有定义且是 3 x 2 矩阵： 

A B AB 


Afl 的维数 


乘积 A 4 没有定义，因 B 为 2 列， A 有 3 行. _ 

的定义对理论与应用是重要的，但下列法则给出了更有效的计算的各元素的方法. 


计算的行列法则 

若乘积有定义，的第 i 行第列的元素是 A 的第 i 行与 B 的第_/列对应元素乘积之 
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和.若表示 的 （ i\_/) 元素， A 为 mxii 矩阵，则 
(AB) V = a„b,j +a n b2j + … 


为证明这一法则，设5 = [*< / IB 的第 j 列是灿；，我们可用 1.4 节的计算 Ar 的规则 

计算 . Aft , 的第 i _ 个元素是 A 的第《_行与向量沁的对应元素之积，恰好是上述规则中计算 
的 ( U ) 元素的方法. 

例5使用行列法则计箅例3中矩阵的两个元素，观察其中涉及的数会使你更好地理 
解计算的两种方法结果相同. 

解 要找出的第1行第3列的元素，考虑 A 的第1行和 B 的第3列，把对应元素相乘 
再加起来，如下所示： 


AB 


H D □ 2(6)+3⑶1_「口 □ 21"| 

□ □ □ 」= [□□□] 

2 3 l U 3 6"| = 「口 □ 2 ll_rn □ 

1 - 5J [1 -2 3 j = [n 1(3)+-5(-2) dJ = [d 13 


口 : -I 6 

对第 2 行第 2 列的元素.用的第2行和 S 的第2 列： 

2 3 I 1 4 3 61 I 口 口 

[□ 1(3)+-5(-2) □ 

例 6 求的第2行，其中 

2-5 01 


, B ： 


3 ■ ■ 

6 -8 -71 
■-3 0 9」 

解 由行列法则，的第2行是由 A 的第2行和 B 的各列相乘所得 


' 2 

-1 

-5 

3 

0' 

-4 

■4 

n 

-6 

1 

6 

一 3 

-8 

0 

-7 

9 

/ 

3 

1 

2 


「 口 □' 

-4+21-12 6+3-8 

□ □ 

□ □ 


r 口 
5 1 

□ □ 
□ □ 


注意，由例 6 可知，计算的第2行时，我们仅需把 A 的第2行写在 B 的左边，得 
「4-61 


[-1 3 -4] 


= [5 1] 


这在一般情况下也是正确的，可由计算的行列法则 得出. 记 row ,(/ l ) 表示矩阵的第 /行， 
则 

row t (AB) = row, (A)B ( 1 ) 

矩阵乘法的性质 

下列定理列出了矩阵乘法的重要性质，/„表示 mxm 单位矩阵，对 R " 中的一切 x , I„x = x 
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定理 2设 A 为 mx / i 矩阵， B 、 C 的维数使下列各式的乘积有定义 • 

a . A ( BC ) = ( AB)C (乘法结合律） 

b . A(B + C ) = AB+AC (乘法左分配律） 

c . (B + C)A = BA + CA (乘法右分配律） 

d . r ( AB ) = ( rA)B = A { rB ) , / •为任意数 

e . I m A = A = AI n (矩阵乘法的恒等式） 

证性质 （ b ) ~ ( e ) 在习题中证明，性质 （ a ) 是由于矩阵乘法对应于线性变换的复合， 
而映射的复合是可结合的.这里给出 （ a ) 的另一个基于矩阵乘积的“列”定义的证明•设 
C = [ci ••- c p ] 

由矩阵乘法的定义 

BC = [ Be , … BCp ] 

A ( BC )=[ A ( Bc ,) ••- A ( Bc „)] 

由 （1) 知， AB 的定义使得对一切; c 有 A (& r ) = ( AB ); c , 所以 

A ( BC ) = [{ AB ) c , - ( AB ) c p ] = ( AB)C ■ 

定理1和定理2中的结合律和分配律说明，基本上矩阵表达式中的括号可像实数运算中那 
样插人和解开，特别地，我们可写乘积 ABC , 不管按 A ( BC ) 或 ( AB ) C e 计算都相同.类似地， 
四个矩阵 ASCD 的乘积可按 A ( BCD ) , ( ABC ) D 或 A ( BC ) D 计算，等等.计算乘积时不管怎样结 
合都行，但左右顺序必须保持不变. 

乘积中的左右顺序是重要的，因为一般来说 AB 与 BA 并不相同.这并不奇怪，因 AB 的列 
是 A 的各列的线性组合，而 BA 的各列是 B 的各列的线性组合.乘积 AB 的因子的位置需要这样 
强调，即 A 被 B 右乘， 或 B 被 A 左乘. 若 = 我们称 A 和 B 彼此可 交换. 


例7 


3 —2 4 3 


证明它们不可交换，即证明 


解 




5 

3 -2 


' [2 01 [1 

1_4 3]=- 


14 3 

5 1 I 110 21 

_ 3 一2」卞9 一2」 ■ 

乘法一般不可交换是矩阵代数与普通实数代数的重要差别，具体例子参阅习题9〜 12. 


BA 


_ '2 0] [5 

~ 1_4 3J 1_3 


警告 

1. 一般情况下， AB ^ BA . 

2. 消去律对矩阵乘法不成立，即若 AB = AC ， 一般情况下 ， B = C 并不成立.（见 
习题 10.) 

3. 若乘枳是零矩阵，一般情况下，不能断定 A =0 或 B = 0.( 见习题 12.) 


0当 S 是方阵而 C 的列数较 A 的行数少时，计算 A(SC) 比 （A5)C 更方便. 
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矩阵的乘幂 

若 A 是 nxn 矩阵， it 是正整数，则 A 4 表示 ik 个 A 的乘积. 

A * = A A 

~I?~ 

若 A 不是零矩阵，且 jc 属于 K "， 则表示 Jt 被 A 连续左乘 Jk 次. 若 k =0, 则就是 Jt 本身 • 
因此 A 11 被解释为单位矩阵.矩阵乘幂在理论和应用中都很有用处（见 2.6 节、 4.9 节及本书后面 
的内容）. 

矩阵的转置 

给定 mxn 矩阵 A , 则 A 的转置是一个 nxm 矩阵，用 A T 表示，它的列是由 A 的对应行构成 
的. 

例8设 



定理 3设 A 与 B 表示矩阵，其维数使下列和与积有定义，则 

a . ( A t ) t = A . 

b . (A + B) r = A r + B r . 

c . 对任意数 /■，（ M ) T = rA T . 

d . ( AB) t = B T A r . 

( a ) - ( c ) 的证明是直接的，这 里省略 .（ d ) 的证明 见习题 33. 通常 ( AB ) t 不等于 A t B t , 
即使乘积 A t B t 是有定义的.定理3 ( d ) 可推广到多于两个矩阵的乘积，叙述 如下： 

| 若干个矩阵的乘积的转置等于它们的转置的乘积，但相乘的顺序相反. 

习题中包括说明这些性质的例子. 

数 值计算 的注解 

1. 在计算机上求出 AB 的最快方法依赖于计算机存储矩阵的方法.标准的高性能 
算法（如 LAPACK ) 中按列计算正如我们所定义的那样.（一个用 C ++ 语言写成 
的 LAPACK 版本是按行计算 ). 

2. AB 的定义使我们可在计算机上用并行算法计算， B 的列可单独或分组分配给不 
同的处理器，因此可以同时计算 AB 的各列. 
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练习题 

1. 因 R" 中向量可以看作 Ztxl 矩阵，转置矩阵的性质也适用于向量，令 

" = [-2 " 

计算 （Ar) T ，;r T A T ，xr T 和; . A T ;r T 是否有定义？ 

2. 设 A 为 4x4 向量， _r 是 R 4 中向量.计算的最快方法是什么？计算乘法的次数. 

习题 2.1 


习题1~2中，计算矩阵的和或乘积，如果它没 
有定义，则说明理由.设 



1. -2 A , B -2 A , AC , CD 

2. A + 2 B , 3 C - E , CB , EB 

下面的习题中，假设每个矩阵表达式是有定义 
的，矩阵 （ 和向量）的维数是相互匹配的. 

3 . 设 A = G ~ t \' 计算 3/ 2-A 及 （AM. 

4. 计算 A -5/ 3 及 (5 / 3 )A ， 其中 



习题5~6中.用两种方法计算乘积 AB; (a) 
根据定义分别计算及处 2 , ( b ) 利用计算 AS 的 
行列法则. 



- 4 -2 - 

6. A = -3 0 , B = 



7. 若矩阵 A 是 5x3, 乘积 AS 是 5x7, S 的维数是 
多少？ 

8 . 若 A4 是 3x4 矩阵， S 有几行？ 

9 . 设 A = ^|和 5 = |^ &取什么值时 


AB = BA ? 



AB = AC { KB*C . 


"l 1 1] ["2 0 O' 

11. 设 A= 1 2 3 ,0= 0 3 0 ， 计算 AO 和 

.1 4 5」 L 0 0 5 - 

A4 , 说明当 A 右乘或左乘以 O 时， A 的行或 
列如何变化，求出 3x3 对角矩阵 S ，不是单位 
矩阵或零矩阵，使 = 

12. 设 A = 求 2x2 矩阵 S 使 AS = 0, 要 

求 S 有两个不相同的非零列. 

13. 设/V..心为 R- 中向量，2为 mx/i 矩阵，把矩 
阵 [Qr, … Qr,] 写成两个矩阵的乘积(任何 一 
个矩阵都不是单位矩阵）. 

14•设 C7 是 1.8 节例6所描述的 3x2 成本矩阵 .C7 
的第一列给出生产产品 B 每美元产出的成本， 
而第二列给出生产产品 C 每美元产出的成本. 

( 成本分为材料、劳动和管理. ） 设？ ，是 R 2 中向 
量，给出一年第一季度生产产品 B 和 C (以美 
元计算）的产出， ？2 ， ？3 ， ？4 是类似的向量，分 
别给出一年第二、三和四季度生产产品 B 和 C 
的产出.给出矩阵 f/2 中的数据的经济解释，其 
中!2 = [?1 ?2 ?3 ? 4 ] 

习题 15-16 中的矩阵 A，S，C 使所说的加法和 
乘法运算能够进行.标出每个命题的真假，给出理由. 
15. a . 若 A，B 为 2 x 2 矩阵，它们的列分别为化， 
a 2 和屯，办 2 ,贝!<»2* 2 ] . 
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b . AS 的每一列是 S 的列的线性组合，并以 A 
的对应列作为权. 

c . AB+AC = A{B + C ). 

d . A T + B T =(A + B ) T . 

e . 矩阵的乘积的转置等于它们的转置的乘积. 

16. a •若 A 与 S 为 3 x 3 矩阵 ， B = [ b , b 2 A 3 ] ，则 

AB = [ Ab , + Ab 2 + Ab {\. 

b . AS 的第 2 行是 A 的第 2 行被 S 右乘 • 、 

c . ( AB)C = ( AC)B . 

d . {ABf = A t B t . 

e . 矩阵和的转置等于它们的转置的和. 

17 . 若 o … [ m ]， 确定 s 
的第一列与第二列. 

18. 设 S 的前两列私和込相等.那么 AS 的各列如 
何（设 AS 有定义）？为什么？ 

19. 设 S 的第3列是前2列的和，那么 AS 的第3 
列如何？为什么？ 

20. 设 S 的第2列全是零，那么 AS 的第2列如何？ 

21. 设 AS 的最后一列全是零，但 S 本身没有零列， 
那么 A 的各列如何？ 

22. 若 S 的各列线性相关，证明 AS 的各列也线性 
相关. 

23. 设 G 4 = /„ ( nx / t 单位矩阵），证明方程 Ar = 0 
只有平凡解.解释为什么 A 的列数不可以多于 
行数. 

24. 设 AO = /„ ( mxm 单位矩阵），证明，对任意 
R m 中的方程 Ac =6有解 .（ 提示： 利用方 
程 ADb = b . ) 解释为什么 A 的行数不可以多于 
列数. 

25. 设 A 是 mx / t 矩阵，存在 / txm 矩阵 C 和 O , 使 
CA = /„ 和 AO = /„ . 证明 m = n 和 C = 0.(11 
示：利用乘积 CAO .) 

26. 设 A 是 3 x / t 矩阵，其列生成 R 3 , 解释如何构 
造一个 / tx 3 矩阵 O 使得 AO = / 3 . 

27题和28题中，把 R " 中向量看作 nxl 矩阵， 


对 R " 中《，》>,矩阵乘积 《 T v 是 1 x 1 矩阵，称为《和 
v 的数量积或内积，它通常当作实数而省略括号. 
矩阵乘积 《 v T 是/ tx / t 矩阵，称为《和*>的外积.这 
些乘积 《 T v *« v T 以后将用到. 

- 2 ] [a 

27 .设 a= 3 , v = b ,计算 a T v ， v T a ， av T 和 va T . 

-4 j [c 

28 •若《和》属于 IT , « T v 和 v T « 有什么关系？ 
«v T 和 v« T 有什么关系？ 

29. 证明定理2 ( b ) 和2 ( c ), 应用行列法则， 
A(S + C ) 的 ( i ，)) 元素可写成 

cin (〜 .+ Cl ; ) + ••• + a ,•„(*〜+ tv ) 或 

^ a ik ( b v + c v ) 

k=l 

30. 证明定理 2( d ).( 提示： （ M ) S 的 （ z ， y ) 元素是 

31. 证明 = 为 mx / t 矩阵.假设对所有 R " 
中的 X ，有 /„ar = ;r. 

32. 证明札 = A ， A 为 mx / t 矩阵.（提示：应用 A /„ 
的列定义）. 

33. 证明定理 3( d ). (提示 ：考虑 ( AS ) T 的第 j 行.） 

34. 给出 （ Afir ) T 的公式，其中; r 是向量， A 和 S 是 
适当维数的矩阵. 

35. [ M ] 读矩阵程序的文件，写出产生下列矩阵的 
命令 （ 不要键人矩阵的任何一个元素）. 

a . 5 x 6 的零矩阵. 

b . 3 x 5 的矩阵，其元素都是 1. 

c . 6 x 6 单位矩阵. 

d . 5 x 5 对角矩阵，对角元素是3, 5, 7, 2, 4. 
检验矩阵代数的新思想或做猜想的一个有用 

的方法，是使用随机选择的矩阵进行计算.用一些 
矩阵验证一个性质并不能证明在一般情况下这个 
性质是成立的，但这样做有助于对性质的理解，如 
果该性质是假的，你会在一些计算之后发现. 

36. [ M ] 写出生成 6 x 4 矩阵，其元素为随机数的命 
令，这些随机数在什么范围内？说出如何生成 
随机 3 x 3 矩阵，它的元素为整数且在 -9 和9 
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之间.（若; c 是随机数，0<^<1 ,则-9.5< 
19( jc -0.5)<9.5.) 

37. [M] 构造一个 4x4 随机矩阵检验 (A + /)_ 
( A -/) = A 2 -/ 是否成立.最好的办法是计算 
(A + /)( A -/)-04 2 -/) 并证明它等于零矩阵. 
对三个随机矩阵进行检验.对三对随机 4x4 矩 
阵检验 （A + B ){ A - B )^ A 2 - B 2 是否成立. 

38. [M] 用至少三对 4x4 矩阵 A 和 fi 检验等式 
(.A + Bf = A T + B T ^ {ABf = A t B t 是否成立. 
(见习题 37. )( 注：多数矩阵程序用表示 
A T .) 


39. [ M ] 设 

0 1 0 0 0 ' 

0 0 10 0 

5=00010 
0 0 0 0 1 

0 0 0 0 0 

对灸= 2, ...,6, 计算 V . 

40. [ M ] 叙述当你计算 A 20 和时发生的情况. 

'1/6 1/2 1/3 ' 

A = 1/2 1/4 1/4 

1/31/4 5/12 


练习题答案 


1]园 


所以 （ Ac ) T =[~4 2 ]，同样 
x T 4 T =[5 3] 


-2 


-3 


: [-4 2] 


如定理3 ( d ) 所说， （ Ac ) T * x T 4 T 相等.其次 


§ 5 3] =口 


t x = [5 3] | = [25 + 9] = 34 


3_ 


如; r T ar 的 lx 1矩阵通常不写括号.最后 A T x T 没有定义，因; r T 没有2行与 A T 的两列 配合. 

2. 最快的方法是按 A ( Ar ) 计算计算如需要16次乘法，每个元素需要4次.计算 A ( Ar ) 还需16次. 
计算 A 2 需要64次乘法，因 A 2 有16个元素，每个需4次.之后 AS 还需16次乘法，总共需80次. 


2 .2 矩阵的逆 


矩阵代数提供了对矩阵方程进行运算的工具以及许多与普通的实数代数相似的有用公式. 
本节研究矩阵中与实数的倒数 （ 即乘法逆）类似的问题. 

实数5的乘法逆是1/5或 V 1 ,它满足方程 

5- 1 .5 = 1 和 5. 5- 1 =1 

矩阵对逆的一般化也要求两个方程同时成立，并避免使用斜线记号表示除法，因为矩阵乘法不 
是可交换的.进一步的，完全的一般化是可能的，当且仅当有关矩阵是方阵戶 


© 也许有人会说一个 mxn 矩阵 A 是可逆的，如果存在 nxm 矩阵 C 和 D 使04 = /„且^0 =夂.但是，这两个方程可 
推出 A 是方阵，且(：=£).因此 A 是可逆的定义同上.见 2.1 节习题23 〜 25. 
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一个 《 x « 矩阵 A 是可逆的，若存在一个《><«矩阵 C 使 
AC = I 且 CA = I 

这里/=/„是 nxn 单位矩阵.这时称 C 是 A 的逆 阵. 实际上， C 由 A 惟一确定，因为若 S 是另一 
个 A 的逆阵，那么将有 fi = fi /= fi ( AC )=( A 4) C =/ C = C , 于是，若 A 可逆，它的逆是惟一的，我们将 
它记为 / T 1 ， 于是 

AA -I =/ 且 A 'A = I 

不可逆矩阵有时称为奇异矩阵，而可逆矩阵也称为非奇异矩阵. 

: i 4 叶 ; 1] 

m=r 

-7 -5¥ 2 5 

」2_|-3 

所以 Cs / r 1 . 

这里给出 2 x 2 矩阵可逆的检验方法，同时给出一个简单的公式给出它的逆矩阵. 


例1若 A : 


则 


AC = \ 


CA = \ 


： lli :] 


定理4 设 A : 


， y$- ad-be ^ 0 , 则 A 可逆且 

L(. d」 

ad-bc\_-c a 」 

若 ad-bc = 0 , 则 A 不可逆 . 

定理 4 的简单证明见 25 题与 26 题. 数 d-fee 称为 A 的行列式，记为 
detA - ad-bc 

定理 4 说明， 2x2 矩阵 A 可逆，当且仅当 detA*0. 

伊 J2 = ^ 的逆 . 

解 有 detA = 3(6)-4(5) = -2*0 ，因此 A 可逆且 

4-'=丄[ 6 叫=「 6/(-2) -4/(-2) 

_ -2[_-5 3 ~ 

可逆矩阵在线性代数中是很重要的 
逆矩阵在实际应用中也会出现，如下面例3所示. 


-糊 3 』二] . 

主要用在计算和公式推导中，如下定理所示，有时 


定理 5 若 A 是可逆 /IX/I 矩阵，则对每一 R " 中的 ft, 方程有惟一解 ; c = n 
证取 R " 中任意一个方程射=6有解，因若以代; C ， 有如 = A (/ T 70 : 


(AA ')b = lb = b , 所以是解.为证明解是惟一的，我们证明若 
事实上，若 A «=*， 两边同乘得 


是一个解，则《必是 n 
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A~'Au = A ~' b , lu = A ~' b , u = A~ l b ■ 

例 3 —条水平的弹性梁的两端支柱，在点1，2, 3受力作用，如图 2-5 所示，设 K 3 中的 
/表示它在这三点受的力，少为梁在这三点的 形变. 利用虎克定律.可以证明 

y=Qf 

这里 D 称为 弹性 矩阵. 它的逆称为刚性 矩阵， 说明 D 与 ZT 1 各列的物理意义 • 



图 2-5 弹性梁的形变 


解记/ 3 =[e, e 2 e 3 ] ,有 D/ 3 =[De, De 2 £ te ,], 向量 = (1,0,0) 表示 1 单位力向下作用 
于点1 ( 其他两点的力为零），以（即 D 的第一列）表示在点1处施加1单位力产生的梁的形 
变.类似的，可以说明 D 的第二和第三列. 

为研究刚性矩阵，注意到方程 / = D —> 计算形变向量^给定时的力向量/记 
D - , = D 1 / J =[ D 1 e I D ' e 2 ,现解释 e , 为形变向量，于是给出产生这个形变的力•因 

此， D 1 的第一列表示，为了使点1的形变为1单位，其他两点形变为0,所需要作用的力•类 
似地， D - 1 的第二和第三列分别表示为了在点2和3产生1单位的形变所需要作用的力 • 在每一 
列中，其中一点或两点作用的力必须为负值（指向上），以在指定的点产生单位形变而其他点没 
有形变.若弹性用每磅力产生的形变的英寸数衡量，则刚性矩阵的元素是每英寸形变所需力的 
磅数. " 

定理5的公式很少用来解方程 Ar = 6，因为 [A «的行变换通常更快 （ 当计算有舍人误差 
时，行变换也更精确 .） 一个可能的例外是 2 x 2 矩阵.这时用 A — 1 的公式进行心算会更容易，如 
下例所示. 

例 4 用例 2 中矩阵 A 的逆矩阵解方程组 

3xi + 4 jc 2 =3 
5xi + 6 jc 2 =7 

解该方程组就是 At = 6,所以 

二 IM ■ 

下列定理给岀可逆矩阵的三个有用事实. 


定理6 

a. 若 A 是可逆矩阵，则 A— 1 也可逆而且 (A— 1 )- 1 :，. 

b . 若 A 和 B 都是 《x« 可逆矩阵，也可逆，且其逆是 A 和 B 的逆矩阵按相反顺序的乘积, 
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即 


(AB)' =B'A l 

c. 若 A 可逆，则 A T 也可逆，且其逆是 A— 1 的转置，即 （ A 7 )— 、 (A— 1 )' 


证为证明 （ a )， 我们需要找矩阵 C 使 

A -1 C = / 且 CA -' = I 

显然 A 满足这些方程.因此 / T 1 可逆且 A 是它的逆阵. 

下一步，为证明 （ b ), 我们应用乘法结 合律： 

{AB){B'A l ) = A{BB')A-' = A1A~' = AA~' =1 
类似地，可以证明因此 Afl 是可逆的，且其逆为 iTU - 1 . 

对于 （ c )， 利用定理 3( d )， 公式从右向左，有 ( A - yATHAA - 1 )、/ 7 :/. 类似的， A t ( A-') t 
= / T =/. 因此 A T 是可逆的，其逆是 ( A 1 ) 7 . ■ 

定理6 ( b ) 的下列推广以后要用到. 


| 若干个” X ”可逆矩阵的积也是可逆的，其逆等于这些矩阵的逆按相反顺序的乘积. | 

在可逆矩阵与矩阵的行变换之间有一种重要的联系，它引出了计算逆矩阵的一种方法，我 
们将看到，可逆矩阵行等价于单位矩阵，而我们可通过观察 A 行化简为 /这一过程求出 A - 1 . 

初等矩阵 

把单位矩阵进行一次行变换，就得到初等矩阵.下列例子说明三种初等矩阵. 

例5设 


E ' = 

"10 0" 

0 1 0 

，五 2 = 

■0 1 (f 

1 0 0 

， £3 = 

'1 0 0" 

0 0 

，A = 

a b c 

d e f 


-4 0 1」 


0 0 1」 


0 0 5」 


g h i • 


计算 £ 2 A 与 £ 3 A , 说明这些乘积可由 A 进行变换得到. 
解我们有 



a b c 


'd e 


a b c 

E、A = 

d e f 

g-4a h-4b i-4c 

， e 2 a = 

a b c 

8 h i_ 

， EjA = 

d e f 
5g 5h 5i 


把 A 的第1行乘 -4 加到第3行得 ( 这是倍加行变换），交换 A 的第1行与第2行得 £ 2 A ， 
把 A 的第3行乘以5得 £ 3 A . ■ 

把 3 x « 矩阵左乘以（即在左边相乘）例 5 中的 £ l 也有相同的结果，即把第1行的_4倍加到 
第3行.特别地， E'l = E' ， 我们看到，尽本身是把单位矩阵以同一行变换作用所得.于是例5 
说明了下列关于初等矩阵的一般事实，见习题27和 28. 

若对 mx « 矩阵 A 进行某种初等行变换，所得矩阵可写成£^，其中 £ Smxm 矩阵，是由 
/„进行同一行变换所得. 
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因为行变换是可逆的，如我们在 1.1 节所示，初等矩阵也是可逆的.若£是由/进行变换所 
得，则有同一类型的另一行变换把£变回 /. 因此，有初等矩阵 F 使耶 =/. 因£和尸对应互 
逆的变换，所以也有 £F = /. 



'10 0 " 

例 6求尽= 0 1 0的逆. 

-4 0 1 

解 为把£，变成/,把第1行的4倍加上第3行，这相应于初等矩阵 
'10 0 ' 

0 1 0 ■ 
+4 0 1 

下列定理给出了判断矩阵可逆的方法，也给出计算逆矩阵的方法. 

定理7 nx « 矩阵 A 是可逆的，当且仅当 A 行等价于/„，这时，把 A 变为/,的一系列初等 
行变换同时把/„变成 A ' 

证设 A 是可逆矩阵，则对任意方程 Ac =6有解（定理 5), A 在每一行有主元位置 （1.4 
节定理 4), 因 A 是方阵，这《个主元位置必在对角线上.这就是说 A 的简化阶梯形是/„，即 
A ~ . 

反之，若 A ~ /„，因每一步行变换对应于左乘一个初等矩阵，就是说，存在初等矩阵 E U -,E P 
使 

A ~£, A ~£ 2 (£, A ) —— E p (£ p _, … A ) = /„ 

即 

… £,A = /„ ( 1 ) 

因为^ …私是可逆矩阵的乘积，因此也是可逆矩阵，由 （1) 式推出 
(£ p …尽 r 1 (£ p …£, )A = (£ p …疒/„ 

于是 A 是可逆的，因它是可逆矩阵的逆（定理 6), 同样有 

于是这就是说， A - 1 可由依次以作用于/„而得到，它们就是 （1) 式 
中把 A 变为/„的同一行变换序列. ■ 

求 / T 1 的算法 

若我们把 A 和/排在一起构成增广矩阵 [A /]，则对此矩阵进行行变换时， A 和/受到同一 
变换，由定理7,要么有一系列的行变换把 A 变成/,同时把/变成 A - 1 , 要么 A 是不可逆的. 
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求 / T 1 的算法 

把增广矩阵 [A /] 进行行化简.若 A 行等价于/，则 [ A /] 行等价于 [/ A - 1 ], 否则 A 没有 


例7求矩阵 A = 

解 


0 1 2 

1 0 3 

4-3 8 


的逆，假如它存在的话. 



— 0 

1 

2 1 

0 0' 


■1 


0 

3 

0 

1 0' 




/]= 


0 

3 0 

1 0 

〜 

0 



2 

1 

0 0 





4 

-3 

8 0 

0 1 


4 

-3 

8 

0 

0 1 





1 

0 

3 0 

1 

0' 


■1 

0 

3 

0 

1 

0' 




0 

1 

2 1 

0 

0 


0 

1 

2 

1 

0 

0 




0 

-3 

-4 0 

-4 

1 


0 

0 

2 

3 

-4 

1 




1 

0 

3 0 

1 

0 

1 


•1 

0 

0 

-9/2 


7 

-3/2 


0 

1 

2 1 

0 

0 



0 

1 

0 

-2 


4 

-1 


0 

0 

1 3/2 

-2 

1/2」 


0 

0 

1 

3/2 

-2 

1/2 


因为 A ~/, 由定理7知 A 可逆，且 


最好把答案验证 一下: 


因 A 可逆，不必验证/1_4 =』 



*-9/2 

7 

-3/2 


A ' 1 = 

-2 

4 

-1 



3/2 

-2 

1/2 



"0 1 2" 

"-9/2 

7 

-3/2' 


"1 0 0" 

AA ~' = 

1 0 3 

_2 

4 

-1 

= 

0 1 0 


4-3 8 

3/2 

-2 

1/2 


0 0 1 


逆矩阵 的另一 个观点 


用 e ,, …，表示/„的各列.则把 [A /] 行变换成 [/ I 1 ]的过程可看作解《个方程组. 

Ax = e t , Ax = e 2 , ■■■,Ax = e „ (2) 

其中这些方程组的“增广列”都放在 A 的右边，构成矩阵 
[A e , e 2 … e „] = [A /] 

方程及矩阵乘法的定义说明 A - 1 的列正好是方程 （2) 的解.这一点是很有用的，因为 
在某些应用问题中，只需要 A - 1 的一列或两列.这时只需要解 （2) 中的相应方程. 


数值计算的注解 在实际中，很少计算 A - 1 , 除非需要 A - 1 的元素.计算和 A 办总 
共需要的运算次数大约是用行变换解 方程如 =6的 3 倍，而且行变换可能更为精确. 
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练习题 


1. 应用行列式判断以下矩阵是否 可逆: 

H I 

' 1 - 2-1 

2. 求 A = _1 5 6 

5^5 


的逆矩阵，假如它存在. 


习题 2.2 

求习题1〜4中矩阵的逆. 
. 「8 61 


5. 用习题1求出的逆矩阵解下列方程组 

+ 6x 2 = 2 
5 x^ 4 x 2 =-1 

6. 用习题 3 求出的逆矩阵解下列方程组 

Sxi + 5 x 2 = -9 


-7 jc ,-5 jc 2 =11 


设 A: 


"3" 

乂 5- ’ 


i2 XXU ， 


a . 求 f 且用它解下列四个方程组 

Ax = b \^ Ax = b】，Ax — Ax = 

b . ( a ) 中的四个方程组可利用同样的行变换 
求解，因系数矩阵是相同的.利用对增广矩 
阵 [A ft , ft 4 ] 做行变换的方法，解 （ a ) 



9. a. 为了使矩阵 B 为 A 的逆，仙=/及&4 = /都 

必须为真. 

b. 若 A，S 是可逆 /ixn 矩阵，则 VS— 1 是 AS 的 
逆. 

c. 若 ^ =[二且 afc-o^O 则 A 可逆. 

d. 若 A 是可逆 /ixn 矩阵，则 方程处 =办对》"中 
任意相容. 

e. 每个初等矩阵都可逆. 

10. a. 若干个可逆 /ix/i 矩阵之积为可逆，且其逆为 

这些矩阵的逆按相同顺序的乘积. 

b. 若 A 可逆，则^的逆就是 A 本身. 

c. 若 A = 且 = 则 A 不可逆. 

d. 若 A 可经行变换化为单位矩阵，则 A 可逆. 

e. 若 A 可逆，则把 A 化为单位矩阵的行变换将 
A— 1 化为 /„. 

11. 设 A 为可逆 /ixn 矩阵， S 为 /ixp 矩阵，证明 
方程 AX=S 有惟一解 

12. 设 A 为可逆 /ix/i 矩阵， S 为 /ixp 矩阵，解释 
为 什么可由行化简求得. 

p[A B ] —— [/ X ]则 X=A-'g| 

若 A 是大于 2X2 的矩阵，则 [A S] 的行化简比 


中的四个方程组. 计算和要快得多. 

8.利用矩阵代数证明若 A 是可逆矩阵，矩阵 D 满 13.设 AB = AC，S 与 C 为/ «xp 矩阵， A 可逆，证 

足 AD = /， 则 D = A- 、 明 S = C. 若 A 不可逆，是否仍有5 =匸？ 

习题9和习题10中，标出命题的真假，给出 14.设 (S-C)D = 0，S 与 C 为 mxn 矩阵， D 可逆， 

理由. 证明 S = C. 
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15. 设 A ， S , C 为可逆 / ix / i 矩阵，找一个矩阵 D 满 
足 （ AJSC)D = /及 D ( ABC ) = I 从而证明 ASC 也 
可逆. 

16. 设是 / ix / i 矩阵， S 可逆， AS 也可逆.证 
明 A 可逆 .（ 提示 ： ^C = AB , 从此式求出 A .) 

17. 假设 A ， S , C 为方阵， S 可逆，从方程 AS = SC 
求出 A . 

18. 设 P 可逆，,用 A 表示 B . 


/ = / 3 .(—般的证明将需要更多的符号 .） 

27. a . 利用 2.1 节方程 （ 1 ) 证明对/ = 1,2,3，有1(^,(4) 
= row ,(/). A . 

b . 证明若交换 A 的1和2行，则结果可以写 
成£4,其中五是由/交换1和2行所得的 
初等矩阵. 

c . 证明若 A 的行3乘以5,则结果可以写成 
EA , 其中五是由/的行3乘以5所得的初 


19. 设 A,S，C 是 nxn 可逆矩阵，由方程 C _1 (A + 

X)B '= l n ^.X . 

20. 设是 nxn 矩阵， A，X,A-AA •可逆，假设 

( A ~ AXy '= X~'B (3) 

a. 说明为什么 S 是可逆的. 

b. 由 （ 3 ) 式求X，如果需要对矩阵求逆，请 
说明为什么该矩阵是可逆的. 

21. 说明若 /ix/i 矩阵 A 为可逆的，则它的各列为 
线性无关. 

22. 说明若 nxn 矩阵 A 为可逆，则它的各列生成 
R' ( 提示： 复习 1.4 节定理 4.) 

23. 设 A 为 /ixn 矩阵，方程处= 0仅有平凡解， 
说明为什么 A 有 n 个主元列和行等价于 . 
由定理7,这说明 A 必定可逆 （ 本题与24题 
将在 2.3 节用到）. 

24. 设对 /ixn 矩阵 A， 方程处=办对任意 R" 中的 
b 有解， 说明 A 必为可逆 .（ 提示： A 是否行等 
价于/,? ) 

习题25和习题26对/1 = |^ 2证明定理 4. 

25. 若设 a d-fc = 0, 方程处=0有多于一个解， 
为什么这说明 A 不可逆？（提 示： 首先考虑 
a=<> = 0 .其次，若不全为0，考虑向量 



26. 证明若知*0,则计算 V 的公式成立. 

习题27和习题28证明例5下面的框中有关初 
等矩阵的命题的特殊情况.此处 A 是 3 x 3 矩阵， 


等矩阵. 

28. 证明若 A 的行3被换成 row 3 (A)-4 rowi(A) , 
则结果可以写成£4 ,其中五是由/的行3被 


换成 row 3 (/)-4 row,(/) 所得的初等矩阵. 


求出习题 29-32 的矩阵的逆，若它们存在的话. 
使用本节介绍的算法. 



1 0 -2 

31. -3 1 4 


2-3 4 


1 -2 r 

32. 4-7 3 

-2 6-4 


33. 利用本节的算法求矩阵1 


0 0 ] 

1 0和 


0 0 0 " 
1 0 0 
1 1 0 


的逆.设 A 是相应的 nxn 矩阵， S 是它的逆， 
猜想 S 的形式，证明仙=/和&4 = /. 


'10 0 ••- 0 ] 
12 0 0 


34 .重复 33 题的方法猜想 A = 1 2 3 0的 


逆，证明你的猜想是正确的. 
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—-2-7-9. 

35.设 A= 2 5 6 ,求出的第3列而不计 

1 3 4 

算其他各列. 


的形变. 

40. [M] 计算习题39中£>的刚性矩阵 /T 1 ，求出在 
点1处引起 0.04 英寸形变所需要的作用力，设 
其他两点处的形变为 0. 


36. [M]S A = 

-25 -9 -27 

546 180 537 

. 求出^的第2和 

0.0040 0.0030 0.0010 0.0005 - 
0.0030 0.0050 0.0030 0.0010 


154 50 149 

41. 關设0 = 

0.0010 0.0030 0.0050 0.0030 

第3列而不计算第1列. 


0.0005 0.0010 0.0030 0.0040 


"1 2 ' 

37. 设 A= 1 3 ,只使用 1,-1 和0作为元素（通 

1 5 

过试错）构造一个 2x3 矩阵 C ,使得 CA = / 2 , 
计算 AC 并使 ACd 3 . 

38. 设 A = 丨丨 只使用1和0作为元素构 

造一个 4x2 矩阵 D, 使得 Ai) = / 2 . 是否存在 
4x2 矩阵 C, 使得 CA = / 4 ? 为什么？ 

'0.005 0.002 0.001' 

39. 设£)= 0.002 0.004 0.002 是一个弹性矩阵， 

0.001 0.002 0.005 

弹性的单位是英寸/镑.设在图 2-5 中，在点1, 
2, 3分别有30, 50和20磅的力作用，求相应 


一条有四个受力点的弹性梁的弹性矩阵，单位 
为厘米/牛顿.在四个受力点处测得形变分别为 
0.08、0.12、 0.16 与 0.12 厘米（见图 2-6), 确 
定在这四个点上的作用力. 

42.【M] 对习題41中的 D, 确定一组力，它在第2 
个点上引起形变 0.24 厘米，在其他三个点上引 
起的形变为 0. 这个答案与 D— 1 的元素有什么 
关系？（提示 ：先考 虑在第2个点上引起1厘 
米形变的问題 .） 



练习题答案 

l.a. det^ ~^J = 3x6-(-4))x2 = 18+18 = 36. 行列式不等于零，矩阵可逆. 
b. detj"^ ;j = 4x5-(-9>x0 = 20#0 ,矩阵可逆. 


6 -9 

c. det =6x6-(-9>x(-4) = 36 — 36 = 0 • 矩阵不可逆. 

-4 6 


2. [A /]- 

1-2-1100 

-1 5 6 0 1 0 


1 -2 -1 10 0 

0 3 5 1 1 0 


•1 -2-110 0' 

0 3 5 1 1 0 


5 -A 5 0 0 1 


0 6 10 -5 0 1 


0 0 0 -7 -2 1 


我们得到形如 Lb £)] 的矩阵.其中 s 是方阵，有一个零行，进一步的行变换不可能将变为/,因此 
我们停止， A 没有逆. 
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2.3 可逆矩阵的特征 


本节复习第1章引人的大部分重要概念，并且与《个未知量《个方程的方程组，以及方阵 
联系起来，主要结论是定理 8. 


定理 8 (可逆矩阵定理） 

设/4为矩阵，则下列命题是等价的，即对某一特定的/4，它们同时为真或同时为假. 

a . /4是可逆矩阵. 

b . /4等价于单位矩阵. 

c . 有《个主元位置. 

d . 方程处 = 0仅有平凡解. 

e . 4的各列线性无关. 

f . 线性变换 jchAx 是一对一的. 

g •对 R " 中任意 A ， 方程至少有一个解. 

h . / I 的各列生成 R ". 

i . 线性变换 jch / U 把 R " 映上到 R n 上. 

j . 存在 《 x « 矩阵(：使 G 4 = /. 

k . 存在 《 x « 矩阵 D 使/1£> =厂 

l. / T 是可逆矩阵. 


首先，我们需要某些记号，若当命题 （ a ) 为真则 （ j ) 也真，我们称 （ a ) (b f (a) ^ j} 
蕴涵 （j )，记为 （ a ) => (j ) • 我们将按图 2-7 中蕴涵的“循环”来证明这些命 ^ 

题的等价性，即这五个命题之一为真可推出其他命题也真，然后我们将把其他 
命题链接进这个循环. 图 2 -7 

证若 （ a ) 为真，则 / T 1 可作为 （ j ) 中的 C , 故 （ a ) => ( j ), 其次，由 2.1 节23题（请 
参阅该习题）， ( j )=^( d ), 又由 2.2 节23题可知 （ d ) 4( c ) • 若/4是方阵且有 n 个主元位置， 
则主元必定在主对角线上，在这种情况下，4的简化阶梯形是/„,因此 （ c ) => ( b ). 同时由 
2.2 节定理7知 （ b ) => ( a ). 至此完成图 2-7 中的证明循环. 

其次，由于可作为 D , ( a ) => ( k ). 又由 2.1 节习题24知 （ k ) => ( g ), 而由 2.2 节习 
题24有 （ g ) => U ), 因此 （ g ) 和 （k ) 被链接进这个 循环. 再根据 1.4 节定理4和 1.9 节定理 
12 ( a ), 得到对任一矩阵来说， （ g )、（ h ) 和 （ i ) 是等价的，因此，通过 （ g ) 使 （ h ) 和 （ i ) 
被链接进这个循环. 

因 （ d )、（ e )、（ f ) 对任一矩阵4是等价的（参见 1.7 节及 1.9 节定理12 ( b ))， 而 （ d ) 在 
这个循环之中，所以 （ e ) 和 （ f ) 也在这个循 环中. 最后，由 2.2 节定理6 ( c ) 有 （ a ) 与 （ 1 ), 
再根据同一个定理，将和 / T 互换后得到 （ l )=>( a ) • 见图 2-8. 这就完成了定理8的证明 .■ 

由 2.2 节定理5,定理8中命题 （ g ) 也可写成“方程处 = A 对任意 1 T 中的 A 有惟一解”.这 
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命题当然也蕴涵 （ b ), 因此也蕴涵 A 为可逆阵- 





(a)<=>( 1) 
图 2-8 

下列事实由定理8及 2.2 节习题8推出. 


设 A 和 fl 为方阵 ， ^AB = I , 则 A 和 g 都是可逆的，且忍二片- 1 , A = B '. _ | 

可逆矩阵定理将所有 《 x « 矩阵分为两个不相交 集合： 可逆 （ 非 奇异） 矩阵和不可逆 （ 奇异〉 
矩阵.定理中每个命题给出了 可逆矩阵的一个性质.定理中每个命题的否命题给出了 nxn 
奇异矩阵的一个性质.例如，每个奇异矩阵不行等价于/«，没有《个主元位置，它的各列 
线性相关，其他的否命题在习题中考虑. 

例1应用可逆矩阵定理来判断 A 是否 可逆： 

' 1 0 -2 
A = 3 1-2 

-5 -1 9 

解 



"l 0-2 


「10 -21 


0 1 4 

- 

0 1 

4 


0 -1 — 1 


0 0 

3 


所以 A 有3个主元位置，根据可逆矩阵定理命题 （c ), A 是可逆的. ■ 

可逆矩阵定理的作用在于它给出了许多重要概念的联系，例如矩阵 A 的列的线性无关性与 
形如 Ac =6的解的存在性关联起来.但是必须强调，可逆矩阵定理仅能用于方阵.例如，若一 
个 4 x 3 矩阵的列线性无关，我们不能用可逆矩阵定理断定形如 Ac =6的方程的解的存在性或不 
存在性. 


可逆线性变换 


回忆 2.1 节矩阵乘法对应于线性变换的复合.当矩阵 A 可逆时，方程可看作关于 
线性变换的一个命题，见图 2-9. 



乘以 A 



图 2-9 把 Ac 变回 X 
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线性变换 r : R ” — R " 称为可逆的，若存在函数 5: R --4 R - 使得 

对所有 R " 中的 X ， S ( T ( x )) = x ( 1 ) 

对所有 IT 中的 X ， T ( S ( x )) = x (2) 

下列定理说明若这样的 s 存在，它是惟一的而且必是线性变换.我们称 s 是 r 的逆，把它 
写成 r ' 

定理9设 r : ir — r " 为线性变换，4为 r 的标准矩阵.則 r 可逆当且仅当4是可逆矩阵. 
这时由 S ( x ) = f x 定义的线性变换 s 是满足 （ 1 ) 和 （2) 的惟一函数. 

证设 r 是可逆的，则 （ 2 ) 说明 r 是从 R " 映上到 it 的映射，因若6属于 r "，x = s ( b ) , 
则所以每个6属于 r 的值域，于是由可逆矩阵定理命题 （ i ), a 为可逆的. 
反之，若 a 是可逆的，令则 s 是线性变换，且显然 s 满足 （1) 和（2)，例如 
S ( T ( x )) = S ( Ax ) = A -'( Ax ) = x 

于是 r 是可逆的. 5的惟一性的证明见习题 39. ■ 

例2设 r : ir — IT 是一对一线性变换，则 r 会如何？ 

解 r 的标准矩阵 a 的列是线性无关的（依 1.9 节定理 12), 所以依可逆矩阵定理， a 是可 
逆的，而且 r 把 R " 映上到 R ". 同时，依定理 9 , r 为可逆. ■ 

数值计算的注解实际工作中，你将会遇到“接近奇 异的” 或者病态矩阵-个可 

逆矩阵，但当它的某些元素稍微改变就变成奇异矩阵.在这种情况下，行变换可能由于舍 
入误差产生少于 n 个主元位置.另外，有时舍入误差也可能使奇异矩阵变成是可 逆的. 

某些矩阵程序对一个方阵计算它的条件数，条件数越大，矩阵越接近 奇异. 单位 
矩阵的条件数是1，奇异矩阵的条件数为无穷大.在极端情况下，矩阵程序可能无法区 
别奇异矩阵与病态矩阵. 

习题41~45说明当条件数大时，矩阵计算可能产生明显的 错误. 


练习题 


1. 确定/! = : 


'2 3 4' 

2 3 4是否可逆. 
2 3 4 


2. 设对某个矩阵/!,可逆矩阵定理命题 （ g ) 不成立.那么形如 Ar =6的方程会 如何？ 

3. 设是 nxn 矩阵，方程/1&: = 0有非平凡解，那么矩阵 /1 S 会如何？ 


习题 2.3 


除非另有说明，本习题中的矩阵都是 nxn 矩 
阵，确定习题1~10中哪些矩阵为可逆矩阵：使用 
尽可能少的计算，检验你的结论. 




'5 0 0" 
-3 -7 0 
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-7 0 4" 

4. 3 0-1 

2 0 9 


" 0 3 -5" 

5. 1 0 2 

-4-9 7 


6 . 


8 . 


1-5-4" 

0 3 4 

-3 6 0 

-1 -3 0 1' 

3 5 8 -3 

-2-6 3 2 

0-12 1 
'1 3 7 4" 

0 5 9 6 

0 0 2 8 

0 0 0 10 


9. [M] 


.4 0 -7 -1 

-6 1 11 9 

7 -5 10 19 

-1 2 3-1 


10. [M] 


'5 3 1 7 9" 

6 4 2 8 —8 

7 5 3 10 9 

9 6 4 -9 -5 

8 5 2 11 4 


习题 11~12 中，矩阵都是 nxn , 习题的每个 
部分都是形如“若<命题1>则<命题2>” 的蕴涵式， 


如果当<命题1>为真时<命题2>总是为真，标记该 


蕴涵式为真.如果有一个例子给出<命题2>为假但 


<命题1>为真，则标记该蕴涵式为假.验证你的结 


论. 

11. a . 若方程 Ac =0 仅有平凡解，则行等价于 
nxn 单位矩阵. 

b . 若的各列生成 IT , 则它的列线性无关 • 

c . 若/!是 nxn 矩阵，则对 R " 中每个方程 

Ac 至少有一个解. 

d . 若方程 Ac =0有非平凡解，则的主元位 
置少于 n 个. 


e . 若 /1 T 不可逆，则/!也不可逆. 

12. a . 若存在 nxn 矩阵 Z ) 使得 AZ ) = / ，则也有 

nxn 矩阵 C 使 C 4 = / . 

b . 若的各列线性无关，则 A 的各列生成 • 

c . 若对每个 R " 中的方程 Ac =6至少有一 
个解，则对每个解都是惟一的. 

d . 若线性变换; Ac 把] r 映到 IT 内，那么 

有 n 个主元位置. 

e . 若存在 R 1 ■中的 ft , 方程不相容，则 
变换4： t -> Ac 不是一对一的 • 

13. 若一个 mxn 矩阵的主对角线以下元素全为0, 
则称之为上三角矩阵（如习题 8). 什么时候 
一个上三角矩阵是可逆的？验证你的答案 • 

14. 若一个 mxn 矩阵的主对角线以上元素全为0, 
则称之为下三角矩阵（如习题 3). 什么时候 
一个下三角矩阵是可逆的？验证你的答案. 

15. 有两列相同的方阵是否可逆？为什么？ 

16. 一个5 x 5矩阵的各列不生成 R 5 ，它是否可能 
可逆？为什么？ 

17. 若4可逆，则 / T 1 的各列线性无关，说明为什 

么？ 

18. 若 C 是 6 x 6 矩阵，对 R 6 中的每一 v ，方程 
Ct = v 相容，是否可能对某个 v ，方程 Cr = v 
有多个解？为什么？ 

19. 若 7 x 7 矩阵 Z 3 的各列线性无关，关于方程 
Qt =6的解会如何？为什么？ 

20. 若 nxn 矩阵£和尸满足 性质奸 =/ ,则£和尸 
是可交换的.说明这是为什么. 

21. 若方程 Gt = _ y 对 R " 中某个 y 有多个解， G 的 
各列能否生成 IT ? 为什么？ 

22. 若方程中的某个0不相容，方程 
Hr =0 会如何？为什么？ 

23. 若 nxn 矩阵欠不能行等价于/,，的列会如 
何？为什么？ 

24. 若 L 是 nxn 矩阵，方程 Lc =0 有平凡解， L 的 
列是否生成 R ” ？为什么？ 
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25. 验证例1前面框内的命题. 

26. 说明为什么当/!的各列线性无关时，/ I 2 的各 
列可以生成 K ". 

27. 证明若 / IS 可逆，则也可逆.你不能使用定 
理6 ( b ), 因为你不能假定4和 S 是可逆的. 
(提 示： 存在一个矩阵 W 使得 = / ，为什 
么？） 

28. 证明若 /1 S 可逆，则 S 也可逆. 

29. 若/!是 nxn 矩阵，方程 Ac =6对『中的某些 
ft 有多个解，则变换; Ac 不是一对一的.其 
他关于这个变换的看法会如何？验证你的答 
案： 

30. 若/!是 nxn 矩阵，变换 ; t h Ac 是一对一的， 
其他关于这个变换的看法会如何？验证你的 
答案. 

31. 设/!是 nxn 矩阵，对 R " 中的每个 ft , 方程 
处=6至少有一个解，不用定理5或8,说明 
为什么每个方程 Ac =6事实上恰好有一个解. 

32. 设 A 是 nxn 矩阵，方程 <4 x =0 仅有平凡解.不 
用可逆矩阵定理，说明对 R " 中的每个方 
程 /lx =6必有一个解. 

习题33和习题34中， T 是由 R 2 到 R 2 内的线 

性变换.说明7■可逆并求出7- 1 . 

33. T ( x l , x 2 ) = (-5 x l +9 x 2 Ax ,- lx 2 ) 

34. 7'( A ： 1 , jr 2 ) = (6 A ： 1 -8^ 2 ,-5*, +7 x 2 ) 

35. 设厂 K ”— K " 为可逆线性变换，说明为什么 r 
既是一对一的又是映上到 R " 的.利用方程 （ 1 ) 
和 （ 2 ), 运用一个或多个定理给出第二种解释. 

36. 设 r 是将 K " 映上到 K " 的线性变换，证明厂 1 
存在且它将 K " 映上到 R " , r - i 是否是一对一 
的？ 

37. 设 T 和是 K" 到 K" 的线性变换，对 K" 中的所 
有 •《： ，有 ra / U ))^. 对 K ” 中的所有; t ， 
W ( x )) = x 是否成立？为什么？ 

38. 设 7" : IT 为线性变换，对 R " 中一对不同 
的《和 v . 有 T ( u ) = T ( v ), T 能否将 R " 映上到 


R "? 为什么？ 

39. 设 r : R "— R " 为可逆线性变换，设 S 和为 
R 1 ■到 R 1 ■的函数，对一切 R " 中的； t ，有 
■ s ( r (； t )) = ；t 和 i /( r (； t )) = ； t ， 证明对 r " 中一切 
v ， 有这将证明 r 有惟一的逆， 
如定理9所说的 那样. （提示 ：给定 r " 中任意 
V ， 我们说对某个;（有》^ = 7'(;«:).为什么？计 
算剔和_.) 

40. 设 r 和 s 满足可逆方程 （1) 和 （2), 其中 r 是 
线性变换.直接证明 s 是线性变换.（提 示： 
给定 R" 1 中的 II,V，设4： = 5(11), pSOO, 则 
nx ) = u , roo = v, 为什么？把 s 作用于方 
程 r(；t)+;ro>)=;r(；t + _y)Wi&. 同样地，证明 
T ( cx ) = cT { x ).) 

41. [ M ] 设某一实验得出下列方程组： 

4.5 x ,+3.1 x 2 =19.249 , . , 

1.6« + l . l ； c 2 =6.843 1 3 ; 

a . 解方程组 （3), 同时解下面的方程组（4)， 
它是由 （3) 的右边四舍五人到2位小数所 
得，在每种情形下，求出准确解. 

4.5^ + 3.1 x 2 =19.25 / A x 

1.6^+ l . lx 2 = 6.84 

b . (4) 的各元素与 （3) 的对应元素的误差不 
超过0.05%,求把 （ 4 ) 的解作为 （ 3 ) 的解 
的近似值时的相对误差. 

c . 用你的矩阵程序求出 （3) 中系数矩阵的条 
件数. 

习题 42-44 说明，如何使用矩阵4的条件数 
来估计方程的计算解的精确度.若 A 和 ft 
的元素大约精确到 r 位有效数字，而/!的条件数约 
为 10* (* 为正整数），则 Ac =6的计算解大约精 
确到至少位有效数字. 

42 .[ M ] 求出习题9中矩阵/!的条件数，构造 R 4 中 
随机向量•（，计算如=6,然后用你的矩阵程 
序计算方程 Ac =6的解; t , ， a 和; t 有几位数字 
相同？找出你的矩阵程序准确存储的数字位 
数，用: t , 代替准确解; t 时有多少位精确数字被 
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丟失？ 

43. [ M ] 对习题10中的矩阵重复习题 42. 

44. [M] 对适当的6解 Ac =6 ,以求得五阶希尔伯特 
(Hilbert) 矩阵的逆的第5列. 

' 1 1/2 1/3 1/4 1/5" 

1/2 1/3 1/4 1/5 1/6 

/!= 1/3 1/4 1/5 1/6 1/7 

1/4 1/5 1/6 1/7 1/8 

1/5 1/6 1/7 1/8 1/9 

练习题答案 


你希望求出的解: t 的元素有多少位精确数 
字？请说明. （注： 精确解为 （ 630, -12 600, 
56 700, -88 200, 44 100 ).) 

45. [ M ] 某些矩阵程序，如 MATLAB ， 有命令可生 
成各阶希尔伯特矩阵.若可能的话，用求逆命 
令求出12阶或更高阶的希尔伯特矩阵4的逆， 
计算并报告你的荦果. 


1. /!的各列显然线性相关，因为第2列与第3列是第1列的倍数.因此由可逆矩阵定理，4不是可逆的 • 

2. 若 （ g ) 不成立，方程对 R " 中至少一个6为不相容. 

3 . 应用可逆矩阵定理于矩阵 zlfi ，假设 zlfi 可逆，则由命题 （ d ) 得到 ： Afir = 0 仅有平凡解，这与所给条 
件相矛盾，因此 AS 不是可逆的. 


2.4 分块矩阵 


我们既可以把矩阵看作一个数的矩形表，也可以把它看作一组列向量，后面这种看法起了 
很重要的作用，因而，我们想考虑 A 的其他分块，把它用水平线和竖直线分成几块，如下面例 
1 所示.分块矩阵也出现在线性代数的现代应用中，因为这些记号简化了许多讨论，并使矩阵计 
算中许多本质的结构显露 出来. 本节也给出复习矩阵代数和可逆矩阵定理的机会. 


例1矩阵 

' 3 0-15 9 -2 

A= -5 2 4 0 -3 1 

3~ll 7 1-4_ 

也可写成 2 x 3 分块矩阵 

A = \ Ali A,2 A,3 1 

\_A 2 1 A 22 A 23 」 

的形状，它的元素是分块（或子矩阵） 

- [j ru 4 

A 2 , =[-8 -6 3], A 22 =tl 7], 



A 23 = [-4] 


■ 


例 2 当某一矩阵出现在物理问题的数学模型中时，例如，电子网络，传输系统，或大 


公司等，会很自然地把 A 看作一个分块矩阵.例如，若一个微型计算机电路板主要由3块超大 


规模的集成电路芯片组成，那么这电路板的矩阵可以写成一般形式 
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AI 

八 2 

A3 

A = 

XT 

Mi 




Mi 



A 的“对角”线上的子矩阵，即 A ,，/^ 和 A 33 是有关3块超大规模集成电路本身的矩阵，而其他 
子矩阵则与这三块芯片之间的相互联系有关. ■ 


加法与标置乘法 

若矩阵 A 与 B 有相同维数且被同样地分块，则自然矩阵的和 A + B 也被同样地分块.这时 
A + S 的每一块恰好是 A 和 B 对应分块的（矩阵）和.分块矩阵乘以一个数也可以逐块计算. 


分块矩阵的乘法 


分块矩阵也可用通常的行列法则进行，就如每一块都是数一样，只要的列的分法与 B 的 
行的分法一致. 

例 3 设 


6 4 



5 2」 


A 的5列被分成3列一组和2列一组 • B 的5行按同样方法分块——被分成3行一组和2行 
一组.我们称 A 和 B 的分块是与分块乘法相一 致的. 的乘积可以被写成 


AB = 


A 1^1 

_ B 2 A2\B x 


^ 12^2 
+ A22B2 


重要的是，在的表达式中的小乘积，每一项应把来自 A 的子矩阵写在左边，因矩阵乘 
法是不可交换的.例如 


因此的上面一块是 


A 1^1 


2-3 1] 

1 5-2」 


6 4 
-2 1 
-3 7 



12 ' 

-5 


^12^2 = 





15 12] f -20 -8 
2-5 - 8 7 




■ 


分块矩阵乘法的行列法则给出了两个矩阵乘积的最一般观点_下面每一个有关矩阵乘积的 


观点已经使用简单的矩阵分块的思想讨论过： （1) 使用 A 的列来给出 Ac 的 定义； （2) AB 的列 
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的 定义； （ 3) 计算的行列 法则； （4) 4的行与矩阵 B 的乘积作为 AB 的行. 在下面的定理 
10仍然应用分块的思想给出 AB 第5种观点 • 

下面的例子为定理10做准备_符号 col *( A ) 表示 A 的第列， row t ( B ) 表示 B 的第行 • 


例4 



和 


5 •证明 


AB = col, (A)rowj(B) + col 2 (A)row 2 (5) + col 3 (A)row 3 (B) 

解上面的每一项都是外积（见 2.1 节习题 27 和 28)， 由计算矩阵乘积的行列法则，有 

「-3 a -3^1 

1… J 

=[ c 1 

[~4c _4d 」 

[ 2e2 /l 

L 5 e 5/」 


coli(A)roWi(B)= 
col 2 ( A ) row 2 ( B ) = 
col 3 ( A ) row 3 ( B ) = 




[a b ]= 
[c d ]- 


[ 5 2 卜 : 


于是 旮。1“ 一 .[1=5 t - 4 + d d + 5 f f ] 

这个矩阵恰好就是注意的 （ 1, 1 ) 元素是3个外积的 （ 1， 1) 元素之和，的 （1,2) 
元素是3个外积的 （ 1， 2) 元素之和，等等. ■ 


定理10 ( AS 的列行展开） 

若 A 是 mx / j 矩阵， B 是 nxp 矩阵，则 

AB = [coh(A) col 2 ( A ) … col n ( A )] 

[row„(B)J 

= colj ( A ) rowj ( B ) + … + col „ ( A ) row n ( B ) 

证对每个行指标 / 和列指标 7 _，乘积 coU ^ row ^ B ) 的(/，>)元素是 col t ( A ) 中元素如与 
rowJB ) 中元素 ~ 的积，因此在 （1) 的和中， (i ， j ) 元素为 

^\j + a , 2办2 ;+•*•+ a in b nj 
(k =1) (k = 2) (k = n) 

而根据行列法则，该和恰好是 AS 的 （ U ) 元素. ■ 

分块矩阵的逆 

下例说明分块矩阵的逆的求法. 

例5形如的矩阵称为分块上三角矩阵，设 A „ 是 pxp 矩阵， A 22 是 gxg 矩阵， 

)_0 / 1 22 」 

且 A 为可逆 矩阵. 求的表达式. 

解 用 B 表示 A - 1 且把它分块使 


row ,( B ) 

row 2 ( B ) 
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u, 叫卜 叫 =「/ p 0"| (2 

L 0 心 J 1_ b 21 b 22 j 1_0 /,」 

这个矩阵方程包含了 4个有关未知子矩阵，…, B 22 的方程，计算 （2) 式左边的乘积得 


A u B n + A {2 B 2 \ = I p (3) 

A 1^12 + ^ 12^22 =0 ( 4 ) 

A 22 B 2 , = 0 ( 5 ) 

A 22 B 21 — Iq ( 6 ) 


方程 （6) 本身并不能说明 A 22 可逆，因我们还不知道 B 22 A 22 =4, 但应用可逆矩阵定理，及 A 22 
是方阵的事实，可以断定 A 22 为可逆且现在我们利用 （5) 式求得 
B 2I = A22 0 = 0 

因此 （3) 式简化为 

Aifin +o = / p 

这说明 A , 是可逆的，且5,,=/^,最后由 （4) 

1 ®12 = — A12B22 和 = — Ai ]* A12A22 

于是 

^- 1= r^n A 2 I _rAn -AuAi 2 A2i~\ ■ 

=[0 4 」 = l_o a 2 - 2 ' 」 

分块对角矩阵是一个分块矩阵，除了主对角线上各分块外，其余全是零 分块. 这样的一个 
矩阵是可逆的当且仅当主对角线上各分块都是可 逆的. 见习题13和 14. 

数值计算的注解 

1. 当矩阵太大时，不适于存储在高速计算机内存中，分块矩阵允许计算机一次处 
理两到三块子矩阵’例如，最近关于线性规划的工作中，一个研究团队把矩阵分为837 
行和51列以简化问题.这个问题的解在 Cray 超计算机上大约需要4分钟 0 . 

2. 某些高速计算机，特别是具有向量传输技术的计算机，当把矩阵分块后再进行 
矩阵运算更 有效气 

3. 高性能数值计算的线性代数专业软件 LAPACK ， 广泛使用分块矩阵进行计算. 

练习题 

1. 证明可逆且求出它的逆. 

2. 计算其中 A ■分块为[ X , X 2 ]. 


°若你不知道这 5 !个分块的列每个包含大约2 5 0000列，也许不觉得解题时间很短.原来的问题有837个方程，包 
含1 275 0000个变量.矩阵中100亿个元素中大约有1亿个不等于0,参阅 Robert E.Bixby.etal. “Very Large-Scale 
Linear Programming: A Case Study in Combining Interior Point and Simplex Methods.” Operations Research, 40, no. 5 
(1992 ) : 885-897. 

㊁分块矩阵算法对计算机的重要性见 Matrix Computations,3rd. ed M Gene H. Golub and Charles F. van Loan ( Baltimore: Johns 
Hopkins University Press, 1996 ). 
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习题 2.4 

习题1~9中，假设这些矩阵的分块适于分块乘 
法， 计算习题1~4的乘积. 



习题 5 ~ 8 中，用求出 x , r , z 的表达式， 
写出你的理由.在这当中你需要对矩阵的维数做 
假设以得到一个公式 .（ 提示： 计算左边的乘积并 
使它等于右边 .） 

化耶 °k]=[^ y 

6. [?Z°][^ C°] = [5 ；] 

7 [?oM[oo；] = [； ?] 

8 T/l fil \X Y Z]_\I 0 Ol 

8 . 1_0 / 」 1_0 0 / J~[o 0 I] 

9. 设 4 是可逆矩阵，求出矩阵 X 和 r 使下列的 
积有所说的形式，并 计算氏 2.( 提示： 计算左 
边的乘积使它等于右边 .） 

I 0 Ol [ A ,, 421 [fin B 12 ] 

X / 0 U 21 /1 22 = 0 
Y 0 /」!>, /1 32 」|_0 B n \ 

\i o oi r / o oi 

10 . 设 c / o 的逆为 z / o , 求 x , r ， z . 

卜 B l \ 1/ "」 

习题 11~12 中，标出各个命题的真假.验证你 
的结论. 

11. a. 若 /! = [▲ A 2 ],B = [B, 6 2 ],八和木的维数 

分别与珥和氏的维数相同，则 
A + B = [i4j + Bx A 2 + ^21 • 

b . 若 t ]' fi = [ y > 则义和_分 
块适合于分块乘法. 


12. a . 矩阵向量乘积 Ac 的定义是分块乘法的特殊 

情况. 

b . 若4人 ft 和 ft 是⑽ 矩阵， = 且 
s =[ fi , s 2 ], 则乘积似有定义，但仙无 
定义. 

13. 设 A = P €，其中 S 和 C 是方阵，证明/!可 

逆当且仅当 S 和 C 都可逆. 

14. 证明例5中的分块上三角矩阵 A 可逆，当且仅 
当戽和屯都可逆.（提 示：若冬和 屯都可 
逆，例5中^的表达式给出4的逆矩阵 .） 这 
个事实对许多估计矩阵特征值的计算机程序 
是很重要的，特征值在第5章讨论. 

15. 设戽可逆，求出 X 与 F 使 



其中 S = A 22 - A 2 l A ^ A n ，矩阵 S 称为/!„的舒尔 
补.类似地， 若知为 可逆，则矩阵 
/1„-八 2 /^/1 21 称为屯的舒尔补，这样的表达 
式常在系统工程和其他地方中出现 • 

16. 设 （7) 式左边的分块矩阵4为可逆，而 A ，为 
可逆.证明/1„的舒尔补 S 也是可逆的.（提 
示： （7) 的右边的外面两个因子总是可逆的， 
证明这一点 .） 当/!和戽都可逆， （7) 导出用 
S ' Ar / 及的其他元素计算 / T 1 的一个公式 • 

17. 当太空卫星发射之后，为使卫星在精确计算过 
的轨道上运行，需要校正它的位置.如图 2-10 
所示.雷达屏幕给出一组向量: t, ，…， A ,它们 
给出卫星在不同时间里的位置与计划轨道的 
比较.设&表示矩阵,矩阵 
G , = X k X ： 需要在雷达分析数据时计算出来， 
当:<^,到达时，新的 G w 必须计算出来，因数 
据向量高速到达，所以计算负担很重.分块矩 
阵的计算起很大作用.计算(? 4 和& +| 的列行 
展开，叙述从 G 如何计算 G i+1 . 
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图 2-10 伽利略探测卫星于1989年10月18日 
发射，在1995年11月初到达接近木星的轨道 

18. 设 X 是 / nxn 矩阵，且为可逆，又设 
M = I „- X ( X T Xy ' X T 加一列 jt 。 于这组数 
据，构成矩阵 W = [X JC 0 ], 计算它的 
(1.1) 元素是 X T X , 证明 X T X 的舒尔补 （ 15 
题）是 x r 0 Mxo ,可以证明数•是 
Wr 1 的 （ 2,2> 元素，在适当假设下.这个 
数有一个有用的统计解释. 

在研究物理系统的工程控制中，一组标准的 
微分方程用拉普拉斯变换转成柯线性方 程组： 



这里 AB . C 分别为矩阵 . s 是 
一个变量. R " 中向量《是系统的“输人”， IT 
中的向量: y 是“输出”， R ” 中向量0«:是“状态” 
向童 .（ 实际上向量都是 s 的函数.但忽略 
这-事实并不影响19题和20题的代数计算 .） 

19. 假设 4- s /„ 是可逆的，把 （8) 看作两个矩阵 
方程的方程组，把第一个方程解的 JT 代人第二 
个方程，结果是形如 lV ( s)H = _ y 的方程， » V ( s ) 
是依赖于^的矩阵，称为系统的传递函數，因 
它把输人《变换成输出 . 求出识⑴，叙述它如 
何与 （ 8 ) 左边的分块的系统矩阵相关.见15题. 

20. 设19题中的传递函数说 ( s ) 对某个 s 为可逆， 
可以证明，逆传递函数 IV ( s )- 1 把输出转换为输 
人，是 A - fiC - ■^对于下列矩阵的舒尔补.求 


出此舒尔补，见15题. 

A-BC-sI. fi] 

~C /J 

21. a . 证明/=/，其中 A = & 

b . 利用分块矩阵证明 M 2 = /, 其中 



22. 推广习题21 ( a ) [不是21 ( b )] 的思想，构 
造一个 5x5 矩阵 M=|^ ^|，使得 M 2 = /， 

C 是 2 x 3 矩阵，验证你构造的矩阵满足要求. 

23. 应用分块矩阵和归纳法证明两个下三角矩阵 
的乘积仍是下三角矩阵 .（ 提示： 一个 (fc + l)x 
(ik + 1) 下三角矩阵 A 可以写成以下形式，《是 
标量， v 是虻中的向量， A 是 JfcxJfc 下三角矩 
阵，参见“学习指导” .） 

A= t a ] 

24. 用分块矩阵归纳证明对 /i = 2,3, …，下面的 
nxn 矩阵 A 是可逆的，其逆为 



归纳证明时，首先假设 A 和 B 是 （fc + l ) x(fc 
+1) 矩阵，将 A 和 B 按类似习题23的方式进 
行分块. 


1 2 0 0 0 ' 

3 5 0 0 0 

25. 不使用行化简，求矩阵 A = 0 0 2 0 0 

0 0 0 7 8 

.0 0 0 5 6 

的逆. 

26. [ M ] 对分块运算，必须能够访问或录人大矩阵 
的子 矩阵. 叙述你的矩阵程序中实现下列功能 
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的命令.设 A 是 20x 30 矩阵. 

a. 显示 A 的从 15 行到 20 行 ， 5 列到 10 列的 
子矩阵. 

b . 把 5 x 10 矩阵 S 从第 10 行第 20 列开始插 
人 A . 

的 50x50 矩阵. （注： 

有可能不需要用命令说明 S 中的零分块矩阵 .） 

27. [M] 设由于内存或维数限制，矩阵程序不可能 
存储多于 32 行 32 列的矩阵，假设某个项目涉 

练习题答案 

1 . 若 G =可逆，它的逆有『的形式. 

计算 

7 01 rw Xl r w x 1 
A /J [y z\~IAW + Y A¥+Z 」 

所以 w ， x ， f，z 满足 vv = /， x = o，Aw + y = o，/«+z = /. 由此 y = 及 z = /， 因此 

m ] 

将左边两个矩阵对调，等式仍成立，所以所给分块矩阵为可逆阵，它的逆是^^=(也可以用可逆 
矩阵定理）. 

2 . = ^]- 的分块和 X 的分块是适于乘法的，因 X T 的列数等于 X 的 

行数.的分块常用于矩阵计算的计算机算法. 


建立形如5 = 


'A 0 " 
0 A T 


及50 x 50矩阵 A 和 S ，叙述你的矩阵程序中 
需要完成下列功能的命令. 

a . 计算 A + B . 

b . 计算 A 5. 

c. 对 R 50 中某个 1 ， 解方程 At=A ， 假设 A 可 
分块为2 X 2分块矩阵 ['] ，其中 A ,, 是可逆 
20x20 矩阵， A 22 是可逆 30x30 矩阵， A , 2 
是零矩阵.（提示 ：用适 当的小方程组来解， 
不使用矩阵的逆 .） 


2.5 矩阵因式分解 

矩阵 A 的因 式分 解是把 A 表示为两个或更多个矩阵的乘积，矩阵乘法是数据的综 合 （ 把两 
士或更多个线性变换的作用结合成一个矩阵），矩阵因式分解是数据的分解，在计算机科学的语 
言中，将 A 表示为矩阵的乘积是对 A 中数据的预处理，把这些数据组成两个或更多部分，这种 
结构可能更有用，或者更便于计算. 

矩阵的因式分解，以及以后的线性变换的分解将在许多关键地方出现.本节主要讨论一种 
在许多重要的计算机程序核心部分出现的因式分解，某些其他的分解在习题中介绍. 

LU 分解 

下面所述的分解，是一些在工业与商业问题中常见的’解一系列具有相同系数矩阵的 
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线性方程（见32题） 

Ax=bi, Ax=bi,---,Ax=b p (1) 

在 5.8 节中，逆幂法通过逐个求解一系列形如 （ 1 >中的方程来估计矩阵的特征值. 

当 A 为可逆，可计算 / r 1 ， 然后计算 A 、， A % , 等等.然而，在实践中， （1) 中第一个 
方程是由行变换解出的，并同时得出 A 的分解，因而剰下的方程由 Zi / 分解求解. 

首先，设 A 是矩阵可以行化简为阶梯形而不必行对换（此后，我们将处理一般情形）， 
则4可写成形式 A = ， L 是下三角矩阵，主对角线元素全是1，17是4的一个等价的 mxn 
阶梯形矩阵.例如，见图 2-11. 这样一个分解称为 Lf / 分解，矩阵 L 是可逆的，称为单位下三角 
矩阵. 


.10 0 * • * *1 



图 2-11 «/分解 


在研究如何构造 L 和之前，我们将看看它们为什么这么有用.当 /i = LI 7 时，方程 Ac = A 
可写成 L ( f / x ) = A , 把 f / jc 写成>，可以由解下面一对方程来求解 jc : 


首 先解以 =6然后解 toy 求得 jc , 见图 2-12. 每个方程都比较容易解，因 L 和£/都是三角矩阵. 
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解解 L _ y = 6仅需6次乘法和6次加法，因这些运算仅需对第5列进行.（在 L 的每个主元 
下的零会在行变换的选取中自动产生 .） 


[L b ]= 


-9' 


0 0 0 
1 0 0 f 
- 510 ^ 
8 3 1 11 


1 0 0 0 -9" 

0 10 0-4 

0 0 10 5 

0 0 0 1 1 


=[/ v] 


对 to = ： y ， 行化简的向后步骤需要 4 次除法，6次乘法和6次加法•（例如，把 [ i ； : V ]的第 4 列 
变成零需要1次除法和3次乘法——把第 4 行的倍数加到上面各行 •） 


Lu V]： 


"3 

-7 -2 

2 -9' 


1 

0 

0 

0 

3' 


■ 3- 

0 

-2 -1 

2 -4 


0 


0 

0 

4 


4 

0 

0 -1 

1 5 


0 

0 


0 

-6 

， x = 

-6 

0 

0 0 

-1 1 


0 

0 

0 


-1 


-1 


行化简成为 [/ : C ] 需62次运算. _ 

Zi ； 分解的计算效率依赖于如何求 L 和 {； ，下面的算法证明，把 A 行化简为阶梯形 i ； 的运 
算同时也求出 L 而基本上不需要额外的运算，因而也求出 Zi ； 分解.在第一次行化简后， L 和以 
就可用来解系数矩阵为 A 的额外的方程. 


07分解算法 

设 A 可以化为阶梯形 i /. 化简过程中仅用行倍加变换，即把一行的倍数加于它下面的另一 
行.这样，存在单位下三角初等 矩阵尽 ，…，心使 

E p -E t A = U ( 3 ) 

于是 

其中 

L = (£ 〆 __£,)-， （4) 

可以证明，单位下三角矩阵的逆也是单位下三角矩阵.（例如见19题 .） 于是 L 是单位下三角矩阵 • 
注意 （3) 中的行变换，它把 A 化为 U ，所以也把 （4) 中的 L 化为/，因 
e , l = ( 心…尽 )(£, … e , r 1 = / 

这一点是构造 L 的关键. 


07分解的算法 

1. 如果可能的话，用一系列的倍加变换把 A 化为阶梯形. 

2. 填充 L 的元素使相同的行变换把 L 变为 /. _ 

第1步不是永远可能的，但当它可能时，上述讨论指出 LU 分解存在.例2将说明如何实现 
第2步.根据上面的说明， L 要满足使用与 （3) 中相同的仏，有 
(E P "E')L=! 
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于是，依可逆矩阵定理， L 是可逆的，（&…£,) = /^.由 （3), L'A = U , 所以步骤2可求出所 
要的 L . 

例2求下列矩阵的 分解： 



解因 A 有4行， L 应为 4 x 4 矩阵， L 的第一列应该是 A 的第一列除以它的第一行主元 元素: 



比较/ I 和 L 的第一列.把 A 的第一列的后3个元素变成零的行变换同时也将 L 的后3个元素变 
成0,同样的道理对 L 的其他各列也是成立的，让我们看一下 A 变成阶梯形的过程. 


2 

4 

-1 

5 - 2"|「2 

4 

-1 

5 

-2 

-4 

-5 

3 

一 8 1 0 

J 

1 

2 

-3 

2 

-5 

-4 

1 8 ~ 0 

-9 

-3 

-4 

10 

-6 

0 

7 

-3 lj [o 

12 

4 

12 

-5 


"2 

4 

-1 

5 

— 2 1 「 2 

4 

-1 5 

-2 

0 

3 

1 

2 

一 3 0 

3 

1 2 

—3 

0 

0 

0 

2 

1 ~ 0 

0 

0 2 

i 

0 

0 

0 

4 

7 J [o 

0 

0 0 

5 ^ 


上式中标出的元素确定了将/ I 化为 t / 的行变换，在每个主元列，把标出的元素除以主元后将结 
果放人 L : 



容易证明，所求出的 L 和满足 = ■ 

在实际工作中，行对换几乎总是必要的，因为部分主元法可以用来提高精确度.（回忆这种 
算法总是选择一列中可以做为主元的元素中绝对值最大的一个作主元 •） 为了处理行对 换上述 
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的分解算法可以稍做改变，以产生 一个置换下三角矩阵 L ， 就是说经过行的置换后它成为 
(单位)下二角矩阵.所得的置换 Lt / 分解可与前面一样的途径解方程心；=6，只要在把[/^ ft ] 化 
简为 [/ J ] 时按照 i 中主元的顺序从左到右进行，并从第一列主元 开始. 介绍 Lt / 分解的参考书 
通常包含 L 为置换下=角矩阵的可能性.详见学习指导书 

数值计算的注解 下列运算次数的计算适用于 AIXAI 稠密矩阵 d ( 大部分元素非零）， „ 

相当大，例如《>30. 0 

1. 计算4的 W 7 分解大约需要2« 3 /3浮算（大约与把 L 4 冽行 化简的次数相 同）， 

而求 / T 1 大约需要2« 3 浮算. 

2. 解 Ay =6和 to = _ y 大约需要2« 2 浮算，因任意 nXn 三角方程组可以用大约浮 
算解出. 

3. 把6乘以 / T 1 也需要2« 2 浮算，但结果可能不如由 L 和 " 得出的精确（由于计 
算及的舍入误差）. 

4. 若/ I 是稀疏矩阵（大部分元素为0)，则 L 和 t / 可能也是稀疏的，然而 / T 1 很可 
能是稠密的.这时，用 W 7 分解来解方程如=6很可能比用 f 快 很多，见习题 31 _ 

电子工程中的一个矩阵因式分解 

矩阵因式分解在构造具有某些性质的电子网络中 碰到. 下列讨论仅是矩阵分解与电路设计 
联系的一个大概. 

设图 2-13 中的方框表示某种电路，具有输人与输出.用表示输人电压与电流 （电 压以 

伏特为单位，电流用安培为单位），输出电压与电流为通常，变换为线性的， 
就是说，存在矩阵称为传 递矩阵 ，使 - 2 



； L 

2 

- - • 

Vi 

电路丨 

V2 输出端 

T- …… J - ' 


图 2-13 具有输人端与输出端的电路 

图 2- M 表 示梯级 网络，它有两个回路（也可以更 多）， 它们串联起来，所以第一个电路的 
输出是第二个电路的输人.图 2-14 左边的电路称 为串联电路， 具有电阻尺（单位为欧姆），右 
端电路称 为并联电路， 有电阻尽，应用欧姆定律，可以证明串联电路与并联电路的传递矩阵为 


见 Applied ed. 3. 8节 

W 住，我们所说的浮算是指 x, + 


Ben Noble and James W. Daniel ( Englewood Cliffs, NJ: Prentice-Hall, 


1988 ). 
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串联电路的传递矩阵 


:] 

并联电路的传递矩阵 



并联电路 

图 2-14 梯级电路 


例3 

a . 计算图 2-14 中梯级网络的传递矩阵. 

b . 设计一个传递矩阵为的梯级网络. 


解 

a . 设 A 和次 分别为串联电路与并联电路的传递矩阵，则输人向量 jc 首先变换为 A〆 ，然后 
变为為幻，两个电路的串联对应于变换的复合，所以梯级网络的传递矩阵为（注意顺序） 


1 0]「1 - 尺 ]_「1 

-\/R 2 lJ[o l + R t /R 2 


( 6 ) 


b . 我们希望把矩阵 = 分解成两个传递矩阵的乘积，如 （6 ) 式，故我们要找出图 


2-14 中况和沁满足 


— 1 / /?2 


-/?i i = r 1 

1 +尺,//? 2 」 _ |_-0.5 


- 8 ' 

5 


由 （ 1，2)元素，/?,=8欧姆，由 （2,1 ) 元素1//? 2 =0_5,而尽=2欧姆，对电阻的这些值，图 


2-14 中网络有所需传递矩阵. ■ 

网络的传递函数总结了网络的输人一输出行为（设计规范），而不必去了解电路内部，为了 
物理上建立网络，使它有特定性质，工程师首先确定这样的网络是否可 实现. 然后尝试把传递 


矩阵分解为对应于较小回路的传递矩阵的积，这些较小回路已经制造 出来. 在交流电的情况下， 
传递矩阵的元素通常是有理复值函数（见 2.4 节习题19和20, 3.3 节例 2), 标准问题是要找一 
个使用最少电子元件的最小实现. 


练习题 


'2-4-2 3 

6—9-5 8 

求矩阵4= 2-7-3 9的分解. 


4 -2 -2 -1 
-6334 
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(注： 4仅有3个主元列，故例2的方法将仅产生 L 的前三列. L 的余下两列由/ 5 得到 .） 
习题 2.5 


习题 1-6 中，用所给的4的 Lt/ 分解来解方程 
Ax^b , 在习题1~2中，同时用通常的行变换解 
方程 Ar . 



_ 3 

-7 


r-7i 


1. 

-3 

5 1 

i yb = 

. 

5 



6 

-4 C 

) 

L ： 

2_ 



1 

0 O' 

「3 - 

7 

-2' 


—1 

1 0 

0-2 

-1 


_ 2 

一 5 K 

L 。 

0 

-1 


" 4 

3 -5 


「： 

21 


2. A = 

-4 

-5 1 





8 

6-8 

J 1 


sj 



1 

0 oV 

4 3 

-5. 



-1 

1 0 

0-2 


2 



_ 2 

0 1J 

0 0 





[ 2 

-1 2 


•r 


3. A~ 

卜 

0-2 


0 i 



_ 8 

-1 5 


•4 」 



■ 1 

0 0] 

「2 - 

L 

2 


A = 

-3 

10 

0-3 

4 



4 

-1 1J 

[0 ( 

) 

1 




•2 

-2 4" 



" o' 


4. A = 

1 

-3 叫 

，b 


-5 



3 

7 5 」 



- 7 」 



"1 

0 

O' 

'2 

-2 

: 41 


1/2 

1 

0 

0 

-2-1 


3/2 

-5 

1 

0 

0 

4 


1 -2 -4 -3 



_-A -1 9 8 


1 0 

0 

O' 

"1 

-2 

-4 

-3. 

2 1 

0 

0 

0 

-3 

1 

0 

-1 0 

1 

0 

0 

0 

2 

1 

^-4 3 

-5 

1 

0 

0 

0 

1 



1 

3 

4 

0 


r 



-3 

-6 

—7 

2 


-2 


6. A = 

3 

3 

0 

-4 

’卜 

—1 



-5 

- 3 

2 

9 


■ 2」 



1 

0 

0 

O' 

■13 

4 

O' 


-3 

1 

0 

0 

0 3 

5 

2 

A = 

3 

-2 

1 

0 

0 0 

-2 

0 


_-5 

4 

-1 

1」 

0 0 

0 

1 


求习题 7-16 中矩阵4的 W7 分解 （ L 为单位 
下三角矩阵）.注意 MATLAB 通常给出置换 Lt/ 分 


解，因为它用部分主元法以提高精确度. 



9 

-A 


17. 当/4可逆时， MATLAB 利用分解 /l = U/( L 可 
能是置换下三角矩阵 ） 来求 /T 1 ,即 /T 1 

用这种方法求题2中 A 的逆（对 L 和 f/ 应用 
2.2 节求逆的算法）. 

18. 如17题，求习题3中/!的逆. 


19. 设 A 为下三角矩阵，对角线上元素非零， 
证明 A 可逆且 /T 1 是下三角矩阵.[提示 ：说明 
为什么4可仅用倍加变换和倍乘变换变为/ . 
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(主元在何处？ ） 接着说明为什么化简 A 的行变 
换把 A 变为/的同时把/变为下三角矩阵 -] 

20 . 设 A 的 W 7 分解为 A = Lt ；. 说明为什么 A 可仅 
用行倍加变换成1/ .( 这里给的条件是课文中所 
证明的结论，而这里的结论是那里给出的条件 .） 

21. 设 A = flC, 为可逆.证明任意一系列把 B 变 
成/的行变换也将 A 变成 C . 其逆不真.因零 
矩阵可分解为 0 = fl-0. 

习题 22-26 介绍某些广泛应用的矩阵分解法. 
有些在本书中后面的章节讨论. 

22. (简化分解）设 A 如练习题，求出 5 x 3 

矩咗 B 及 3 x 4 矩阵 C , 使 A = BC , 推广这一 
想法到 A 是 mxn 矩阵的情形 ， A = 仅有 

3个非零行. 

23. (秩 分解） 设 mx / i 矩阵 A 有分解 A = CB , C 
是 mx 4 矩阵， £) 是 4 xn 矩阵. 

a . 证明 A 是4个外积的和.（见 2.4 节 . > 

b . 设 m = 400 和 n = 100, 说明为什么程序员倾 
向干存储两个矩阵 C 和 D 而不存储矩阵 A • 

24. ( 0?分解）设 A = G 及，其中 G 和及都是 " x/i 
矩阵，/?可逆上三角矩阵， G 满足 G T G =/, 
证明对任意属干 R " 的方程 Ar = A 有惟一 
解.叙述求解的算法 .（ 提示： 首先说明为什 
么 G 为可逆 .） 

25. (奇异值分解）设 A = W ) V T ， 这里 1/. V 是 》 ix»i 
矩阵. U T U = l . V T V = I . D 是对角矩阵，主 
对角线上元素 ct ,, ct 2 ，…, CT , 为正数.证明 A 可 
逆，并给出 / T 1 的-个 表达式. 

26. (谱分解）设 3 x 3 矩阵 A 可分解为 A = 

P 是可逆 3 x 3 矩阵， D 是对角矩阵 

"1 0 0 ' 

D= 0 1/2 0 

0 0 1/3 

证明在计算 A 的高次幂时，这种分解是有用 
的，使用 P 及 D 的元素求出 AW 和 it 为 
正整数）的较为简单的公式. 


27. 设计两个不同的梯级网络使其输人为12伏特 
与6安培而输出为9伏特与4安培 • 

28. 证明，若三个并联电路 （ 电阻为凡，拓，札）串 
联在-.起，所得网络与一个单一的并联电路有 
相同的传递 矩阵. 求该电路的电阻的表达式 • 

29. a . 计算下图的网络的传递矩阵. 


b . 设 a =[_ 1/4 1 • 设计网络，使它的传递 

矩阵为利用适当的矩阵分解 • 



30. 在习题29中，求出 A 的另一分解并用以设计 
传递矩阵为 A 的另一梯级网络. 

31. [ M ] 对下图中平板的稳态传热问题的解可近似 
地用方程 Ac 的解来逼近，其中 ft = (5,15,0, 
10,0,10,20,30) , 

4-1-1 
-1 4 0-1 

-1 0 4-1-1 

-1-14 0-1 

-1 0 4-1-1 

-1-1 4 0-1 

-1 0 4-1 

-1-1 4 


0。 0 ° 0。 0。 



10° 10。 10。 10。 


(参阅 1.1 节习题 33.) A 中未写出的元素为 
0. A 的非零元素都位于主对角线相邻的一条带中. 
这样的带 状矩阵 在许多应用中出现，往往非常大 
( 有数千的行和列但相对窄的带）. 
a . 使用例2的方法求 A 的分解，注意两个因 
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子都是带状矩阵 （ 有两条非零对角线在主对角 
线之上或之下）.计算来检验你的结果- 

b . 使用分解解 Ajc =*. 

c . 求出 / T 1 , 注意 f 是稠密矩阵，无带状结构•当 
/ U 艮大时， L 和"可以存储在比足 1 小得多的空 
间内. 这个事实是更多使用 A 的 U ； 分解而不 
用^本身的一个原因. 

32. 下列带状矩阵可用来估计一根梁中的非稳态 
热传导，其中梁上的各点仍，…,仍的温度随时 
间变化 . 0 

矩阵中的常数 C 依赖于梁的物理性质. A * 为 
各点之间距离.时间间隔 A / 的长度是两次温度 
测量的间隔. 

设对 fc =0, l ,2, - , R 5 中向量表示在 fcA / 时刻 


各点的 温度. 若梁的两端保持于0°,则温度 
向量满足方程认= 0,1,—)，其中 

(1+2C) -C 
-C (1 + 2C) -C 
A= -C (1 + 2C) -C 

-C (1 + 2C) -C 
-C (1 + 2C) 

Ajc Ax 


a . 求出当 C = 1 时. A 的 LG 分解.有三条非零对 
角线的矩阵称为三对角矩阵，因子 L 和1/为双 
对角矩阵. 

b . 设 C = 1 及 . 应用 A 的 Lt / 分 

解求温度分布 A ， f 2 , * 3 和 G . 


练习题答案 



把每一个标志出的列除以它顶端的主元，所得的列构成 L 前三列的下半部分，这就使 L 化为/的变换 
对应于 A 化为1/的变换，用/ 5 的后两列作为 L 的后两列，使它成为单位下三角矩阵. 


2 



6 


' 3 


2 


-3 


5- 

4 


6 


一5 

-6 


-9 


10 



1 


1 0 0 0 0' 

3 1 


3 10 0 0 

1 -1 1 … 

> ^-― 

1-1 10 0 

2 2 -1 


2 2-110 

-3 -3 2 


-3 -3 2 0 1 




132 


第 2 章 


2.6 列昂惕夫投入产出模型 


在 Wassily Leontief 获得诺贝尔奖的工作中，线性代数起着重要的作用.如第1章开始所提 
到的，本节所叙述的模型是现在世界各国广泛使用模型的基础. 

设某国的经济体系分为《个部门，这些部门生产商品和服务.设: r 为 R " 中产出向置，它列 
出了每一部门一年中的产出.同时，设经济体系的另一部分（称为开放部门）不生产产品或服 
务，仅仅消费商品或服务，为最终需求向置，它列出经济体系中的各种非生产部门所需求的 
商品或服务.此向量代表消费者需求、政府消费、超额生产、出口或其他外部需求. 

由于各部门生产商品以满足消费者需求，生产者本身创造了中间需求，需要这些产品作为 
生产部门的投人，部门之间的关系是很复杂的，而生产和最后需求之间的联系也还不清楚.列 
昂惕夫思考是否存在某一生产水平: r 恰好的满足这一生产水平的总需求 （ ： r 称为供给），那么 
{ 总产出中间需求}+{最终需求 (1 ) 
列昂惕夫的投人产出模型的基本假设是，对每个部门，有一个单位消费向量，它列出了该部门 
的单位产出所需的投人.所有的投人与产出都以百万美元作为单位，而不用具体的单位如吨等 
( 假设商品和服务的价格为常数）. 

作为一个简单的例子，设经济体系由三个部门组成——制造业、农业和服务业.单位消费 
向量 c ,， c 2 ， c 3 如表 2-1 所示. 


表 2-1 每单位产出消费的投入 


购买自 

制造业 


服务业 

制造业 , 

0.50 


0.20 

农业 

0.20 


0.10 

服务业 

0.10 


0.30 


例1如果制造业决定生产100单位产品，它将消费多少？ 
解计算 



0.50 


'50' 

lOOc^lOO 

0.20 


20 


0.10 


10 


为生产100单位产品，制造业需要消费制造业其他部门的50单位产品，20单位农业产品，10 
单位服务业产品. 丨 

^制造业决定生产々单位产出，则在生产的过程中消费掉的中间需求是 ； c lCl , 类 似地， 若々 和 
^3表示农业和服务业的计划产出，则 ； c 2 c 2 和; c 3 c 3 为它们的对应中间需求. 三 个部门的中间需求为 
{ 中间需求}:叫, +々 c 2 +； c 3 c 3 =Cr (2) 

这里 C 是消耗矩阵 [ Cl C2 C3 ], 即 




0.50 0.40 0.20' 
C= 0.20 0.30 0.10 
0.10 0.10 0.30 

方程 （1 ) 和 （ 2 ) 产生列昂惕夫模型 • 



把 I 写成办，应用矩阵代数，可把 （4) 重写为 

lx-Cx-d ( 5 ) 

(I — C)x=d 

例 2考虑消耗矩阵为 （3) 的 经济. 假设最终需求是制造业50单位，农业30单位，服务 
业20单位，求生产水平; c . 

解 （5) 中系数矩阵为 

"1 0 0] [0.5 0.4 0.2] \ 0.5 -0.4 -0.2" 

I-C= 0 1 0 - 0.2 0.3 0.1 = -0.2 0.7 -0.1 
0 0 lj |_0.1 0.1 0.3] [-0.1 -0.1 0.7 
为解方程（5)，对增广矩阵作行变换 

' 0.5 -0.4 -0.2 50] [" 5 ^ -2 500] 「1 0 0 226' 

-0.2 0.7 -0.1 30——2 7 -1 300 - 0 1 0 119 

-0.1 -0.1 0.7 20 J [-1 -1 7 200 J [0 0 1 78 

最后一列四舍五人到整数，制造业需生产约226单位，农业119单位，服务业78单位. ■ 
若矩阵 /- C 可逆，则我们可应用 2.2 节定理5,用 /- C 代替 A ， 由方程 (/- C ) jc = rf 得出 
x = a-cy l d. 下列定理说明，在大部分的实际情况下， /- C 是可逆的，而且产出向量: r 是 
经济上可行的，亦即: r 中的元素是非负的. 

在此定理中，列的和表示矩阵中某一列元素的和.在通常情况下，某一消耗矩阵的列的和 
是小于1的，因为一个部门要生产一单位产出所需投人的总价值应该小于 1. 

定理11设 c 为某一经济的消耗矩阵，为最终需求.若 r 和的元素非负， C 的每一列 
的和小于1,则 （/- CT 1 存在，而产出向量 

x = (i-cy'd 

有非负元素，且是下列方程的惟一解 

x-Cx^d 

下列讨论说明定理成立的理由，且给出一种计算 (/- C )-' 的新方法. 

(/- C )- 1 的公式 

假设由表示的需求在年初提供给各种工业，它们制定产业水平为:的计划，它将恰好 
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满足最终需求，由于这些工业准备产出为,它们将提出对原料及其他投人的 要求. 这就创造 
出对投人的需求 Crf . 

为满足附加需求 Crf , 这些工业又需要进一步的投人为 C ( Ci /) = C 2 rf ,当然，它又创造出第 
二轮的中间需求，当要满足这些需求时，它们又创造出第三轮需求，即 C ( C 2 rf ) = C 3 rf ， 等等. 


理论上，这个过程可无限延续下去，虽然实际上这样一系列事件不可能一直发生下去.我 
们可把这一假设的情形表示如表 2-2 所示. 


表 2-2 



要满足的霈求 

为满足此霈求霈要的投入 

最 终需求 d Cd 

中间需求 

第一轮 

Cd 

C { Cd )^ C 2 d 

第二轮 

C 2 d 

c ( c 2 d ) = cV 

第=轮 

cV 

C ( cV)=cV 



为了满足所有这些需求的产出水平: r 是 

x=d + Cd + C 1 d + C 3 d+-=U + C + C 2 +C , + -)d (6) 

为了使 （6) 有意义，我们使用; f 列代数恒 等式： 

(/- CX / + C + C 2 + ••• + C m ) = /- C m+1 (7) 

可以证明，若 C 的列的和都严格小于1，则 /- C 是可逆的，当 m 趋于无穷时 C m 趋于0,而 
/- C m +1 4/ •(这有点类似于当正数 f 小于 1 时，随着 m 增大，广 40.) 应用 （7), 我们有 
当 c 的列的和小于 1 时， (/- cr 1 =/+ c + c 2 + c 3 +--+ c m (8) 

我们将 （8) 解释为当 m 充分大时，右边可以任意接近于 (/- C )- 1 . 

在实际的投人产出模型中，消耗矩阵的幂迅速趋于0,故 （8) 实际上给出一种计算 (/- cr 1 
的 方法. 类似地，对任意 rf , 向量 CV 迅速地趋于零向量，而 （6) 给出实际解 (/- c ): r = rf 的方 
法.若 C 和 rf 中的元素是非 负的，则 （6) 说明: r 中的元素也是非负的. 

(/- C )- 1 中元素的经济重要性 

(/- C 广中的元素是有意义的，因它们可用来预计当最终需求改变时，产出向量; r 如何改 
变.事实上， （/- cr 1 的第）列表示当第 y 个部门的最终需求增加 1 单位时，各部门需要增加产 
出的数量.见习题 8. 

数值计算 的注解 在任何应用问题中（不仅是经济学）方程如= 6总可以写成 
(/-(：):«:=< /的形式，其中 C = /- A . 若方程组很大而且稀疏（大部分元素为 0)， 可能 
C 的各列元素绝对值之和小于1,这时 C m 40, 若(："趋向于零足够迅速， （6) 和 （8) 
可以用来作为解方程的实际方法，也可用来求 A — 1 . 
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练习题 

设某一经济有两个部门，商品和服务部门.商品部门的单位产出需要 0.2 单位商品和 0.5 单位服务的 
投人，服务部门的单位产 出需要 0. 4 单位商品和 0.3 单位服务的投人.最终需求是20单位商品和30单位 
服务，列出列昂惕夫投人产出模型的方程 - 
习题 2.6 



习题1~4讨论-个经济体系，它分为制造业、 
农业和服务业三个 部门. 见上图.制造业每单位 
产出需要 0.10 单位制造业 产品. 0.30 单位农业产 
品和 0.30 单位服务产品 投人. 每单位农业产出霄要 
0.20 单位它自己的产出， 0.60 单位制造业产出， 0.10 
单位服务产出.服务业的每单位产出消耗 0.10 单位 
服务， 0.60 单位制造业产品，但不消耗农业产出 • 

1 . 构造此经济的消耗矩阵，若农业要生产100单 
位产出，产生的中间需求是什么？ 

2 . 为了满足最终需求为18单位农业产品（对其他 
部门无最终需求）.总的产出水平应为多少（不 
要计算逆矩阵）. 

3. 为了满足最终需求为18单位制造业产品（对其 
他部门无最终需求），总的产出水平应为多少 
(不要计算逆矩阵） • 

4 . 为了满足最终需求为18单位制造业产品 .18 单位 
农业产品，0单位服务，总的产出水平应为多少. 

5. 考虑生产模型 jr = C *+ d , 该经济体系有两个部 


门，其中 



0.5' 

0.2 



应用逆矩阵来确定最终需求. 


6 . 重复习题5,取（：= 


' 0.1 0 . 6 ' 
0.5 0.2 


-[：!]■ 


7. 设(:和 d 如题 5. 

a . 为满足最终需求为部门1的1单位产品，产 


出水平应为多少？ 


b . 用逆矩阵求出最终需求为 


51' 

30 


时的总产出 


水平. 

c . 应用事实謝 go 山)和⑴ 

的答案以及题5的答案有何关系. 

8 . 设 (:为 消耗矩阵，它的列的和小于1，设 X 
为满足最终需求 d 的产出向量， Ar 为满足不同 
的最终需求 Arf 的产出向量. 
a . 证明若最终需求由 d 改变为 d+Arf ,则新的 
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产出水平必须为; c + Ar ,于是 Ar 给出需求改 
变 Arf 时产出改变的量. 

b. 设 M 为 R" 中第1个元素为1其他元素为0 
的向量，说明为什么对应的产出 Ar 是 
(/-C)— 1 的第1列，这证明， （/-C)- 1 的第1 
列给出当第1部门的最终需求增加1单位时， 
其他部门需要增加的产出. 

9. 设某一经济有3个部门，解它的列昂惕夫方程， 
给出 

'0.2 0.2 0.0] 「40 

C = 0.3 0.1 0.3 , d = 60 

0.1 0.0 0.2」 80 

10. 美国经济在1972年的消耗矩阵 C 具有下列性 
质，矩阵 (/-cr 1 的每个元素都是正的.这说 
明仅增加某一部门的产出的需求对其他部门 
的影响是什么 0 

11. 列昂惕夫产出方程 ;c = Cr+rf 通常与对偶的价 
格方程 

p = C T p + v 

联系在一起.其中 p 为价格向置，它的元素列 
出各部门产出的单位价格， v 是增值向置，它 
的元素是每单位产出附加的价值（增值包括工 
资、利润、折旧等）.经济中重要的事实是国 
内生产总值 （GDP) 可用两种方式 表示： 

{ 国内生产总值 } = p T rf = v T ;c 
证明第二个等式.（提 示： 用两种方式计算 
P T x.) 

12. 设 C 为消耗矩阵，当 myoo 时 C "40, 对 

m = ,令 Z)„=/ + C + … + C' 求出把氏 

和联系的差分方程，得出由 （8) 计算 

练习题答案 
已给下列 数据： 


a-cr 的迭代算法. 

13. [ M ] 下列的消耗矩阵 C 是基于 1958 年美国经济 
的投人产出数据，把 81 个部门合并成 7 个大的 
部门： （ 1 ) 非金属家用及个人产品， （ 2 ) 最终 
金属产品 （ 如汽车）， （ 3 )基础金属产品及矿业， 
(4) 基础非金属产品与农业， （5) 能源， （6) 
服务业， （7) 娱乐与其他产品 @ 求出满足最终 
需求 rf 的产出水平（单 位： 百万美元）. 



14. [ M ] 习题 13 中的需求向量是 1958 年数据.但 
列昂惕夫在讨论中应用了一个接近 1964 年的 
数据： 

</ = (99640,75 548,14444,33501,23 527, 
263985,6526) 

求出满足此需求的产出水平. 

15. [M] 用方程 （6) 解13题，设; c w =rf ,对灸=1， 
2,…，计算; c w =rf + Gr_, 需要多少步才能 
得到有4位有效数字的 答案？ 
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列昂惕夫投人产出模型为 * = &+<* ，其中 




2.7 计算机图形学中的应用 


计算机图形是在计算机屏幕上显示或活动的图像 • 计算机图形学的应用广泛，发展迅速- 
例如，计算机辅助设计 （ CAD ) 是许多工程技术的组成部分之一，比如本章介绍中提到的飞机 
设计过程.娱乐行业对计算图形学做了最引人人胜的应用——从黑客帝国的特技效果到 
PlayStation 2电脑娱乐系统和 Xbox 游乐器游戏 • 

绝大多数工业或商业的交互计算机软件在屏幕上应用计算机图形显示以及其他功能，如数 
据的图形显示，桌面编辑以及商业或教育用的幻灯片等，因此，任何学习计算机语言的学生至 
少要学会如何应用2维 （ 2 D >图形. 

本节考虑用来操纵和显示图形图像的一些基本的数学方法，例如飞机的线形轮廓模型■这 
样的一个图像 （ 图片）是由一系列的点和曲线组成，以及如何填充由直线和曲线所围成的封闭 
区域.通常，曲线用短的直线段逼近，而图形用一系列的点来定义. 

在最简单的二维图形符号中，字母用于在屏幕上做标记.某些字母作为线框对象存储，其 
他有弯曲部分的字母还要将曲线的数学公式也存储进去 - 

例1图 2-15 中的大写字母 N 由8个点或顶点 确定. 这些点的坐标可存储在一个数据矩阵 
£> 中. 

顶点 1 2 3456 78 

jt 坐标 「0 0.5 0.5 6 6 5.5 5.5 0 l = D 
y 坐标 |_0 0 6.42 0 8 8 1.58 8 j ~ 



图 2-15 常规的 N 

除 /) 以外，还要说明哪些顶点用线相连，但我们省略这些细节. ■ 

图形对象使用一组直线线段描述的主要原因是，计算机图形学中标准变换把线段映射成为 
线段 .（ 例如，见 1.8 节习题 27.) 当描述这些对象的顶点被变换以后，它们的像可以用适当的直 
线连结起来得到原来对象的完整图像. 

例 2 给定 A = 描述剪切变换 jcbAc 对例 1 中字母 N 的作用 • 

解由矩阵乘法的定义，乘积 AD 的各列给出字母 N 各顶点的像. 
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— 0 0.5 2.105 6 8 7.5 5.895 2 

.(JO 6.420 0 8 8 1.580 8 


变换过的顶点画在图 2-16, 同时还画上相应于原来图形中连线的线段. 

图 2-16 中斜体的 N 看来有些太宽，为此，我们可以用倍乘变换使它变窄. 



图 2-16 斜体的 N 


例3先作如例2的剪切变换，然后再把 jc 坐标乘以一个因子0.75,求此复合变换的矩阵. 
解把每个点的; c 坐标乘以 0.75 的矩阵为 



所以复合变换的矩阵是 


从 = [0.75 0] [1 0.25] = [0_75 0.1875] 
复合变换的结果如图 2-17 所示. 



图 2-17 N 的复合变换 


计算机图形学中的数学是与矩阵乘法紧密联 系的. 但是.屏幕上的物体的平移并不直接对 
应于矩阵乘法，因为平移并非线性变换.避免这一困难的标准办法是引人所谓齐 次坐标_ 


齐次坐标 

R 2 中每个点 ( U ) 可以对应于炉中的 ( u , l ). 它们位 于町平 
面上方1单位的平面上_我们称( X ,30有齐次坐标 ( nl ) ，例如， 
点(0,0)的齐次坐标为 (0,0,1). 点的齐次坐标不能相加.也不能乘以 
数，但它们可以乘以 3 x 3 矩阵来做变换. 

例4形如的平移可以用齐次坐标写成 
+ + 这个变换可用矩阵乘法来实现： 



沿 


[:]方向 


平移 



姖阵代数 


139 


1 0 h 

X 


x+h 

0 1 k 

y 

= 

y+k 

0 0 1 

i 


1 


例5 R 2 中任意线性变换也可用通过齐次坐标乘以分块矩阵 
阵，典型的例 子是： 


A 0 
0 1 


实现，其中 A 是 2 x 2 矩 


cosip -simp 0 
sin^> cosip 0 


0 

1 

1 O' 

0 0 


"s 0 O' 

0 1 0 

0 0 1 


0 

0 1 


0 0 1 


绕原点逆时针 
旋转角度 P 


关于 y = 
的对称 


X乘以 j 
y 乘以I 


复合变换 

图形在计算机屏幕上的移动通常需要两个或多个基本变换.这些变 
换的复合相应于在使用齐次坐标时进行矩阵相乘. 

例6求出 3 x 3 矩阵，对应于先乘以 0.3 的倍乘变换，然后旋转90。， 
最后对阁形的每个点的坐标加上 (-0.5,2) 做平移.见图 2-18. 


'0.3 0 01 

0 0.3 0 

0 0 1 

"0 -1 0l ro.3 0 01 

0 01 10 0.3 0 

0 0 1 I |0 0 


x 


'0.3 0 O ' 

X 

y 

l 

缩小 > 

0 0.3 0 

0 0 1 

y 

l 



旋转后的图 


平移后的图 
图 2-18 


10 ~0.5* 

"0 -1 0" 

0.3 0 0" 


0 -1 ~0.5" 

0.3 0 O ' 


0 -0.3 ~0.5' 

0 1 2 

0 0 1 

1 0 0 

0 0 1 

0 0.3 0 

0 0 1 

二 

1 0 2 

0 0 1 

0 0.3 0 

0 0 1 

= 

0.3 0 2 

0 0 1 


三维计算机图形学 


计算机图形学的最新和最激动人心的应用是分子 模型. 对三维图形学，生物学家可观察到 
模拟的蛋白质分子.并用以研究药物分子.生物学家可以旋转和平移一种实验药物的分子使它 
们附着于蛋白质 分子. 研究潜在的化学反应的能力对现代药物和癌症研究是很重要的.事实 
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上，药物设计的进展依赖于计算机图形学构造有真实感的分子和它们的交互作用的仿真戶 
现在的分子模型的研究集中于虚拟现实，即一种环境，研究者在其中可以看到并且感觉药 
物分子渗人蛋白质分子，在图 2-19 中.这样的有实体感的反馈是由能够将力量可视化的远程控 
制器提 供的. 另一种虚拟现实的设计包括用一个头盔和手套来感觉头、手和手指的运动•头盔 
包含两个细小的计算机屏幕，每个眼睛一个，将此可视环境变得更为真实，这是对工程师，科 
学家与数学家更大的挑战.我们这里考虑的数学打开了这方面的研究的大门 • 



图 2-19 虚拟现实中的分子模型 （ 北卡罗来纳大学 Chapel 
Hill 分校计算机科学系，照片由 Bo Strain 提供） 


齐次三维坐标 

类似于二维情形，我们称 Uy , z ， l ) 是 R 3 中点 Uyz ) 的齐次 坐标. 一般地，若则 

( XXZ ，//) 是 Uy , z ) 的齐次坐标，且 

X Y Z … 

x = —, v = —, z = —— I 1 ) 

H H H 

U ,_ y ， Z ， l ) 的每一个非零的标量乘法得到一组 （ x , y , Z ) 的齐次 坐标. 例如 （10,-6,14,2) 和 
(-15,9, -21,-3) 都是 (5,-3,7) 的齐次坐标. 

下列说明分子模型中，把一个药物分子移人蛋白质分子的变换 • 

例7给出下列变换的 4 x 4 矩阵. 

a . 绕>轴旋转30° (习惯上，正角是从旋转轴（本例中是 y 轴）的正半轴向原点看过去的 
逆时针方向的角）. 

b . 沿向量 p = (-6,4,5) 的方向平移. 

解 a . 首先构造 3 x 3 矩阵表示旋转.向量 I ?,向负 z 轴旋转到(咖30。,0，-咖30。) = (4/2,0,-0.5), 
向量 e 2 不变， e 3 向正 JC 轴旋转到 ( sin 30°，0， cos 30°) = (0.5,0, W /2). 见图 2-20 •由 1.9 节，这个旋 


© Robert Pool, “Computing in Science”. Science 256, 3 April 1992, p.45. 
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转变换的标准矩阵为 

J 3/2 0 0.5 

0 1 0 

-0.5 0 S /2 

所以齐次坐标的旋转矩阵为 

S /2 0 0.5 O ' 

0 10 0 
-0.5 0 S /2 0 
0 0 0 1 

b . 我们希望 ( jc ,; y ， z , l ) 映射到 ( jc - 6,; y +4, z +5, l ), 所求矩阵为 
10 0 - 6 ' 

0 10 4 

0 0 1 5 

0 0 0 1 





图 2-20 _ 

透视投影 

三维物体在二维计算机屏幕上的表示方法是把它投影在一个可视平面上 （ 我们忽略其他重 
要步骤，例如选择可视平面上显示在屏幕上的部分 •） 为简单起见，设叮平面表示计算机屏幕， 
假设某一观察者的眼睛向正 2 轴看去，眼睛的位置是 (0,0, rf )， 透视投影把每个点 Oc ，; y , z ) 映射为 
点 ( jc *，_ y *，0)， 使这两点与观察者的眼睛位置（称为透视 中心） 在一条直线上，见图 2-21 ( a ). 
xz 平面上的三角形（在图 2-21 a 中）画在 b 中，由相似三角形知 
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图 2-21 由 （ JC ， J , Z ) 到的透视投影 
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顶点 

1 2 3 4 5 6 7 8 

"1 0 0 0] [3 5 5 3 3 5 5 31 1" 3 5 5 3 3 5 5 3 " 

01 0 0 11001100 1 1 0 0 1 1 0 0 

pry = = 

00 0 0 55554444 0 0 0 0 0 0 0 0 

0 0 -1/10 1 11111111 1_0.5 0.5 0.5 0.5 0.6 0.6 0.6 0.6 

为得到 R 3 坐标，使用 （1) 式，把每一列的前3个元素除以第4行的对应元素，得到 

顶点 

1 2 3 4 5 6 7 8 

"6 10 10 6 5 8.3 8.3 5" 

2 2 0 0 1.7 1.7 0 0 

.0 0 0 0 0 0 0 Oj ■ 

本教材的网页上有计算机图形学的有趣应用，包括对透视投影的进一步讨论.网上的一个 
计算机项目与简单的动画有关. 

数值计算的注解 三维物体的连续移动需要计算大量的 4x4 矩阵，特别地，当曲面光 
滑时，用来使它更有实体感，并有适当的光线，图形工作站有 4x4 矩阵运算及图形算 
法嵌入于芯片和电路中，这样的工作站可以每秒做数十亿次矩阵乘法以实现三维游戏 
程序中有真实感的颜色的 变化戶 
进一步阅读 

James D. Foley, Andries van Dam, Steven K. Feiner, and John F. Hughes, Computer 
Graphics: Principles and Practice, 3rd ed. (Boston, MA: Addison-Wesley, 2002)， 

Chapters 5 and 6. 

练习题 

图形绕 R 2 中一点 p 的旋转是这样实 现的： 首先把图形平移 -p， 然后绕原点旋转，最后平移回去 p. 
见图2-23,使用齐次坐标构造绕点(-2, 6) 旋转 -30° 的 3x3 矩阵. 






») 朝原点平移 -p c) 绕原点旋转 


CH 


d) 平移回去 p 


图 2-23 图形绕点 p 旋转 


0 见 Jan Ozer，“High-Performance Graphics Boards，’，PC Magazine 19, 1 September 2000, pp. 187-200. 也见 “The 
Ultimate Upgrade Guide: Moving On Up", PC Magazine 21, 29 January 2002, pp. 82-91. 
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习题 2.7 

1. 哪-个 3 x 3 矩阵对 R 2 齐次坐标的作用与例2中 
的剪切变换矩阵 A 相同？ 

2. 用矩阵乘法求出由数据矩阵 D = |^ $ 决定 

的三角形在关于 y 轴的对称变换下的像.画出 
原来的三角形和它的像. 

习题3~8中，求出产生所述复合二维变换的 
3 x 3 矩阵，用齐次坐标. 

3. 先沿 (3,1) 方向平移，然后绕原点旋转 45°. 

4. 先沿 (-2, 3) 方向平移.然后把 X 坐标乘 0.8, y 坐 
标乘 1.2. 

5. 先关于 jc 轴对称，然后绕原点旋转 30°. 

6. 先绕原点旋转30°,再关于 jc 轴对称. 

7. 绕点 (6, 8) 旋转 60°. 

8. 绕点 (3.7) 旋转 45°. 

9. 2 x 200 的数据矩阵 D 包含200个点的坐标.要 
把这些点用 2 x 2 的任意矩阵 A 和 I ?变换，需要 
多少次乘法？考虑两种方法和 

讨论你的结果对计算机图形学计算的含意. 

10. 考虑下列二维 变换： D 是拉伸变换 （ jc 轴与 y 
轴同时乘一个数），是旋转变换， T 是平移 
变换，£>是否与 /} 可交换？即是否对 R 2 中一 
切 J ： 有 D ( R ( x )) = R ( D ( x )), D 是否与 r 可交 
换？ 是否与 r 可交换？ 

11. 计算机屏幕上的一个旋转变化有时可用两个 
剪切-拉伸变换的复合来实现.这样可以加快 
计算从而确定某一图像如何以屏幕像素显示 
在计算机屏幕上 .（ 屏幕由按行和列排列的小的 
点组成，称为像素 .） 第一个变换4垂直地剪 
切然后压缩每列的 像素； 第二个变换禹水平剪 
切然后拉伸每行的像素.设 



1 

0 0" 


sec 炉 一 tan 炉 0 

Ai = 

situp 

cos 炉 0 

» ^2 = 

0 1 0 


0 

0 1 


0 0 1 


证明这两个变换的复合是 R 2 中的旋转变换. 


12. R 2 中的旋转变换通常需要4次乘法，计算下面 
的乘积，证明一个旋转矩阵可以分解为三个剪 
切变换的乘积 （ 每一个剪切变换只需作一次乘 
法）. 



13. 通常二维图形的齐次坐标变换涉及形如 


的 3 X 3 矩阵. A 为 2 x 2 矩阵， p 是 R 2 

中的向量.证明这样一个变换等同于在 R 2 中 
的一个线性变换之后再作一个平移.（提 示： 
求出包含分块矩阵的一个适当的矩阵分解 .） 

14. 证明题7中的变换等价于绕原点的一个旋转之 
后再沿方向 p 平移，求出向量 p . 

15. R 3 中什么向量有齐次坐标（1/2,-1/4,1/8, 
1/24) ? 

16- (1,-2 ,3 .4) 与 (10,-20,30,40) 是 R 3 中同一个 
点的齐次坐标吗？为什么？ 

17. 给出一个 4 x 4 矩阵，它将 R 3 中的点绕 jc 轴逆 
时针旋转 60°. 



18- 给出 4 x 4 矩阵，它将 R 3 中的点绕 z 轴旋转 
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-30°，然后沿/» = (5,-2,1) 方向平移. 

19. 设 S 是顶点为(4.2，1.2,4), (6,4,2) , (2, 2, 6) 的 
三角形，求出透视中心在 （0,0，10) 处时 S 的透 
视投影的像. 

20. 设 S 是顶点为 (9,3,-5) , (12,8,2) , (1.8,2.7，1)的 
三角形，求出透视中心在 (0,0,10) 处时 S 的透 
视投影的像. 

习题21和习题22考虑在计算机图形学中显示 
颜色的设置方法.计算机屏幕上的颜色是由3个数 
确定的，它列出电子枪射击到屏幕上的 
红、绿、蓝荧光点的能量的大小.（第4个数说明 
颜色的亮度或强度 .） 

21. [ M ] 观察者在屏幕上看到的实际颜色是被屏幕 
上荧光点的数量与类型决定的.每个计算机显 
示器制造商必须在数据 ( R , G ， B ) 和使用三原色 
X , Y , Z 的国际 CIE 颜色标准之间转换.一种对 
持续时间短暂的荧光的转换是 

练习题答案 

从右向左将这三个变换对应的矩阵组合在一起.使用/» = (-2,6),«»(-30°) = 75/2，如(-30。) = -0.5,我 

们有 


平移 P 

'1 0 -2 

绕原点旋转 

" V 3/2 1/2 0 

平移 -P 

0 2" 


' V 3/2 1/2 V 3-5 ' 

0 I 6 

-1/2 V 3/2 0 

0 1 -6 

= 

-1/2 V 3/2 -3^3+5 

0 0 1 

0 0 I 

0 0 ij 


0 0 1 


2.8 R" 的子空间 

本节讨论] r 中重要的向量子集，称为子空间.通常子空间与某个矩阵 a 有关，它们提供了 
关于方程 Ax = b 的有用信息.本节的概念和术语将在本书以下部分经常出现 e 

定义 K ” 中的一个子空间是 K ” 中的集合//,具有以下三个 性质： 
a . 零向量属于 //. 

b •对//中任意的向量《和 v ， K + V 属于 //. 


"0.61 

0.29 

0.150" 



X 

0.35 

0.59 

0.063 

G 

= 

Y 

0.04 

0.12 

0.787_ 

B 


Z 


计算机程序将传送颜色信息到屏幕上，使用标 
准 CIE 数据 （ x ， y ， z ). 求出把这些数据转换为 
屏幕电子枪所需的 (/ J ， G ， S ) 数据的方程. 

22. [ M ] 商业电视的信号广播用向量 ( y ,/，(2) 描述颜 
色.若屏幕是黑白的，则只使用 y 坐标 . （ 它给 
出比用 Cffi 颜色数据更好的单色图像. ）YIQ 与 
“标准”的 RGB 颜色的对应关系是 


Y ' 


0.299 

0.587 

0.114" 

R 

1 

= 

0.596 

-0.275 

-0.321 

G 

[ q \ 


0.212 

-0.528 

0.311 

B 


( 显示器制造商将改变矩阵元素使之适合它的 
RGB 屏幕 .） 求出由电视台发送的 YIQ 数据转 
换为电视机屏幕所需的 RGB 数据的方程. 


© 本节放在这里，使读者可以跳过以下两章的大部分内容直接进人第 5 章. 如果读者计划先读第 3 章和第 4 章，再读 
第 5 章，则可以跳过本节. 
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C. 对 W 中任意向量 U 和數 C, CU 属于 f/. 

换句话说，子空间对加法和标量乘法运算是封闭的.你将在以下例子看到，第1章中所讨 
论的向 M 集合大部分是子空间.例如，通过原点的一个平面是一种很典型的子空间，可以看作 
例 1 中子空间的一种实例.见图 2-24. 



图 2-24 Span { v ,, v 2 } 是通过原点的平面 


例1若 v , 和 v 2 * R ” 中的向量， A /= Span { F ,， v 山则 H 是 R " 的子空间.为证明这一点，注 
意零向量属于《 (因 Ov ,+ Ov 2 是 F , 和6的线性组合），现取《中任意两个向量，比如说 
u = s l v l + s 2 v 2 ,^=^+^ 2 , 

那么 IM- V = (5, + )v, + ( s 2 + 1 2 ) v 2 

这证明了 B + vS Vl * V 2 的线性组合，因此属于《，同样，对任意数 C ， 向量属于//, 
因为 C« = C(S|V, + v 2 ) = (Ci, ) v , + (Ci 2 ) v 2 . ■ 

若 v , 不等于零而 Vl mv , 的倍数，则 v , 和^仅生成通过原点的直线.所以通过原点的直线是子 
空间的另一个例子.见图 2-25. 




图 2-25 v , ^0 9 v 2 = kvi 


例2不通过原点的一条直线不是子空间，因它不包括原点，同样，图 2-26 说明 L 在加法 
或标量乘法下不是封闭的. 



不属于 L 2 m > 不属于 t 


图 2-26 
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例3设属于 K "， v , ，•••,〃,的所有线性组合是 IT 的子空间，这一结论的证明与例1 
中类似，我们将称 S P an { v ,,...， v p } 为由 V ,,…,卜生成（或张成）的子空间. ■ 

注意 R ” 是它本身的子空间.因为三个性质都满足.另一个特殊的子空间是仅含零向量的集 
合，它也满足子空间的条件，称为零子空间. 

矩阵的列空间与零空间 

应用中， K " 的子空间通常出现在以下两种情况中，它们都与矩阵有关. 

定义矩阵 A 的列空间是 A 的各列的线性组合的集合，记作 Col A . 


若八：!^…<!„]，它们各列属于 R ", 则€01焱和81»11{<1 | ，...,<1„}相同，例3说明， mxn 矩阵 
的列空间是 K " 的子空间. 



' 1 -3 

-4 


- 3 _ 

例4设八= 

-4 6 

-3 7 

一 2 

6 

yb = 

3 


，确定 i 是否属于 A 的列空间. 


解向量6是 A 的各列的线性组合，当且仅当6可写成的形式， X 属于 R 3 , 也就是说， 
当且仅当方程 Ac = A 有解.把增广矩阵 [A «进行行 变换： 

r - « ^ r, ^ r_ ， 


' 1 -3 ^ 3 


1-3-4 3 


1 -3 -4 3' 

4 6-23 

- 

0 -6 -18 15 


0-6 -18 15 

-3 7 6 -4 


0-2 - 6 5 


0 0 0 0 


可知 = 6 相容，从而 6 属于 Coll 



■ 


例4的解答说明，当线性方程组写成 Ac 的形式， A 的列空间是所有使方程有解的向量 
办的 •* 合. 


定义矩阵 A 的零空间是齐次方程 Ac = 0 的所有解的集合，记为 NulA . 

当 A 有 n 列时， / Lc =0 的解属于 E "， A 的零空间是 R ” 的子集.事实上， NulA 具有 K ” 的子 
空间的性质. 


定理12 mx « 矩阵 A 的零空间是 K " 的子空间•等价地，《个未知数的 m 个齐次线性方程 
的解的全体是 K ” 的子空间. 

证零向量属于 NulA ( 因 A 0 = 0 >， 为证明 Nul A 满足其他两个性质，取 NulA 中两个向量 



148 


第 2 章 


«和 v , 即设 A «=0 和 Av =0, 那么由矩阵乘法的性质， 

A(u + v ) = Au + Av =0 + 0 = 0 

于是 《 + v 满足如 = 0,所以 《+ v 属于 Nul A , 同样，对任意数 c ， A ( oi ) = c ( Ab ) = c (0) = 0, 这 
就证明了 cu 也属于 Nul A _ ■ 

为检验给定向量 v 是否属于 Nul A ， 只要计算 Av ， 看它是否零向量，因 Nul A 是用其中每 
个向量必须满足的一个条件来描述的，我们说零空间是隐性定义的 • 相反，列空间是显性定义 
的，因 Col A 中的向量可由 A 的各列（利用线性组合）构造出来 . 0 
子空间的基 

因 为子空 间一般含有无穷多个向量，子空间中的问题最好能够通过研究生成这个子空间的 
一个小 的有限集合来解决，这个集合越小越好.可以证明，最小可能的生成集合必是线性无关的 • 

定义 R " 中子 空间 //的一组基是//中一个线性无 关集， 它生成 H . 

例 5可逆《><«矩阵的各列构成 R ” 的一 组基. 因为它们线性无关，而且生成] T , 这由逆 
矩阵定理可知.一个这样的矩阵是单位矩阵，它的各列用^ 表示： 



T 

0 


1 


"o' 

— 

0 

，沒2 = 

0 

，…，^ 1 = 

0 

1 


称为 R " 的标准基.见图 2-27. 



下例说明，求出方程丸 c = 0 的解的参数向量形式实际上就是确定 NulA 的基，这一事实将 
在第5章应用. 

例6求出下列矩阵的零空间的基. 

'-3 6 -1 1 -7' 

A = 1 -2 2 3 -1 
2 -4 58^ 


0 Nul A 与 Col A 的区别将在 4.2 节讨论. 
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解首先把方程 >lx = 0 的解写成参数向量形式. 

1 -2 0 -1 3 0 x, - 2x 2 - x 4 +3^5 =0 

A~ 0 0 1 2 -2 0， ^,+2^-2^ 5 =0 

.0 0 0 0 0 oj 0 = 0 

通解为 A = 2 x 2 + x t - 3^, x 3 =- 2x i + 2x 5 , x 2 , x i , x 5 为自由变量 • 



方程 （1 ) 说明 NulA 与 《， v ， w 的所有线性组合的集合是一致的，即 { U , v , w } 生成 NulA ， 事实上 
“， v , h < 的构造保证了它们线性无关，因为 （1) 式说明，若 

0- X 2 U -^ X 4 V + X 5 W 

则权等于零（观察向量 + U + 的第 2 ， 4 ，5个元素），因此 { m ， v ， w } 是 Nul A 的 
一组基. _ 

求矩阵的列空间的基比求零空间的基容易.然而，这个方法需要一些说明，让我们从一个 
简单情形开始. 

例7求下列矩阵的列空间的基： 

'1 0 -3 5 0' 

B= 0 1 2-10 

~ 0 0 0 0 1 

0 0 0 0 0 

解 用 6 ,，…， 6 5 表示 S 的列，注意63=-%+ 2* 2 A = 54 - 62 , 63 和6 4 是主元列的线性组合， 
这意味着私，…，化的任意线性组合实际上仅是私，^和 &的线 性组合事实上， g v * Colfi 的任 
意向量，例如说， 

v = c x b \ + c 2 &2 + C363 + c 4 b 4 + c^bs 

则把&和匕代人，可把 V 写成 

V=c 1 6,+c 2 6 2 +c 3 (-3 A , +2* 2 )+ c 4 (56, -b 2 ) + c 5 b 5 

它是私 ’込和込的线性组合，所以汍上為}生成 Col S ， 又私， 6 2 和6 5 为线性无关，因为它们是单 
位矩阵的列，所以 S 的主元列构成 Col S 的基. ■ 

例^中的矩阵 fi 是简化阶梯形.为处理一个一般的矩阵 A ，注意 4 的各列之间的线性相关关 
^可表示为形式 Ar = 0 ( 若某些列不含在特殊的线性相关关系中，则; c 的对应元素为零）.当 A 
行化简为阶梯形 S 时，它的列虽然改变，但方程如 = ❶和 批 = ❶有 相同的解集即 A 的列与 s 
的列有相同的线性相关关系. ’ 
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例8可以证明矩阵 


i 4 = [< i , a 2 ••- flj ] = 


1 3 3 2 -9" 

- 2-2 2-8 2 

2 3 0 7 1 

3 4 -1 11 -8 


行等价于例7的矩阵 B , 求 Col 4的一组基- 

解由例7，4的主元列是第1，2, 5列•同时有込= -36, +功 2 和= 5 ft - ,因行变换 
不影响列的线性相关关系，有 

a 3 二-如丨+如：!和 fl 4 =5 a ,- a 2 

经验证这是成立的！由例7的讨论，生成 A 的列空间不需要用办和同样.必是线 
性无关的，因 fl ,， 私,之间的任意线性相关关系必然也使有同样的关系.因汍太 A } 为 
线性无关，丨也线性无关，因此是 ColA 的一组基. ■ 

例8的讨论可以用来证明下列定理. 


定理13 矩阵的主元列构成列空间的基. 

警告 小心，要用4的主元列本身作为 ColA 的基，阶梯形 B 的列本身通常并不在4的 
列空间内.（例如在例 7 和例《中， B 的列的最后一行都是零，不可能生成 /i 的列空间 .） 
练习题 


1 -1 51 

1. 设片= 2 0 7 

-3 -5 -3 
'0 1 0 ] 

2. 设 A = 0 0 1 

0 0 0 

3. 设一个 nxn 矩阵 A 是可逆的，则 Nul A 和 Col A 会如何？ 


是否属于 Nul A ? «是否属于 Col A ? 给出理由. 


. 求 Nul A 中的一个向量和 Col A 的一个 向量. 


习题 2.8 

习题1~4画的是 R 2 中的子集，假设这些集合 
包含边界线，说明这些集不是 R 2 中的子空间的 
理由 .（ 例如，找出//中两个 向量， 它们的和不属 
于// ,或求出//中一个 向量， 它的倍数不属于 《 , 
画出图形 . > 


2 . 


■ 
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' 2 


-4' 


' 8' 

5. Vi = 

3 

， v 2 = 

一5 

,w = 

2 


-5 


8 


-9 


确定 w 是否属于 


R 2 的由 v , 和》> 2 生成的子空间？ 



J " 


41 


「 51 


-4' 

6. 设 v ,= 

-2 

4 

, v 2 = 

- 7 

9 

. v 3 = 

-8 

6 

，“ = 

10 

-7 


3 






-5 


确定 


. 是否属于 R 4 中由 { v ,， v 2 , v ,} 生成的子空间? 



.2 


-3 


_-4. 


6" 

Vi = 

-8 

， v 2 = 

8 

， v 3 = 

6 

，P = 

-10 


6 


-7 


-7 


11 


,A = [V| 


Vi v 3 ]. 

a . | v „ v 2 , v 3 } 中有多少个向量？ 

b . Col A 中有多少个向量？ 

c . p 是否属于 Col 4?为什么？ 


8. 设 v , : 


-3' 


•- i 


' O' 


r 

0 

， v 2 = 

2 

,V 3 = 

-6 

，P = 

14 

6 


3 


3 


-9 


， P 是否 


属于 Col A . i4 = [v, v 2 v 3 ]? 

9. A 和 p 如习题 7, 判断 p 是否属于 Nul A. 

10. « = (-2,3,1) , A 在习题 8 中给出，确定 《 是否 
属于 Col A. 

习题11~〗2给出整数 p 和 g 使 Nul A 是 IT 的 
子空间 ， Col A 是的子空间. 

32 1-51 


11. A -- 


2-5 


12. A = 


1 2 3' 

4 5 7 

1-5-10 

2 7 11 

13. >4如习題11,求 Nul A 和 Col A 中的一个非零 
向量. 

14. A 如习题12,求 Nul A 和 Col A 中的一个非 
零向量. 

习题15~20中，确定哪个集是 R 2 或 R 3 中的 
基？验证你的答案. 


15. 


19. 


16. 


20 . 


在习题 2] 和习题22中，标出每个命题的真假. 
并验证你的答案. 

21. a . R •的一个子空间是任一集《满足 （ i ) 零向 

量属于 《,( ii ) «，v 和 u + v 属于 c 
是数，属于 W . 

b . 若 V ,, …， V ,属于 R " ，则 SpanfVi , …， v p } 等价 
于矩阵 [ v , … v ,] 的列空间. 

C- 一个 m 行齐次线性方程组有《个未知量，其 
全体解组成的集合是 R " 的一个子空间. 

d . —个； 《 xn 可逆矩阵的列构成的一组基. 

e . 行变换不改变矩阵的列之间的线性相关关 
系. 

22. a . R ” 中的子集//是一个子空间，若零向量属 

于 //• 

b . 给定 R " 中的向量，这些向量的所有 
线性组合所构成的集合是 R " 的一个子空 
间. 

c . 矩阵的零空间是 R ” 的一个子空间. 

d . 矩阵 A 的列空间是 Ac 的解的集合. 
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e . 若 fi 是矩阵 A 的阶梯形，则 S 的主元列构成 
Col A 的一组基. 

习题 23~26 中，给出矩阵 A 和 A 的阶梯形， 
求出 Col 和 Nul 的基. 



27. 构造一个 3 x 3 矩阵 A 和一个非零向量》，其 
中 ft 属于 Col A 但与 A 的任一列都不同. 


28. 构造一个 3 x 3 矩阵 A 和一个非零向量》，其 
中 ft 不属于 Col A . 


29. 构造一个 3 X 3 矩阵 A 和一个非零向量》，其 
中 ft 属于 Nul A . 

30 . 设矩阵 A = [ fll … fl p ] 的各列线性无关，说明 
为什么 { fli , …， fl p } 是 Col A 的一■组基. 


习题 31-36 中，尽可能全面地回答，给出理 
由. 

31. 设 F 是 5x5 矩阵，其列空间不等于 R 5 , 则 
Nul F 会如何？ 

32 . 若/?是 6 x 6 矩阵， Nul R 不是零子空间，则 
Col /?会如何？ 

33. 若 G 是 4x4 矩阵， Col G = R 4 ,» 属于 R 4 , 则 
对形如 Qr =6的方程，其解会如何？ 

34. 若 P 是 5x5 矩阵， Nul P 是零子空间 j 属于 
R 5 , 则对形如段=»的方程，其解会如何？ 

35. 若 S 是 5x4 矩阵，有线性无关的列，则 Nul S 


会如何？ 

36. 若 mxn 矩阵 A 的各列构成 IT 的一组基，则该 
矩阵的形状会如何？ 


[M] 习题 37 和习题 38 中，求出给定矩阵 A 的 


列空间和零空间. 


37. A = \ 


38. A = \ 


"3-5 0-1 3 

-7 9 -4 9 -11 

-5 7 -2 5 -7 

3 -7 -3 4 0- 

' 5 2 0 -8 -8' 

4 12-8-9 

5 13 5 19 


-8 -5 6 8 5 


练习题答案 


1. 为确定 w 是否属于 Nul A ，只需计算 



1 -1 5' 

—-7 — 


O' 

Au = 

2 0 7 

3 

= 

0 


-3-5-3 

L 2」 


0 


结果显示《是属于 Nul A . 要确定 1 /是否属于 Col A 需要做更多的工作.化简增广矩阵 [A W ] 成阶梯 
形来判断方程 = i /是否 相容： 


'i-i 5 -i 


•i -i 5 -i 


■1-1 5 -7' 

2 0 7 3 

- 

0 2-3 17 

- 

0 2 -3 17 

-3-5-3 2 


0 _8 12 -19 


0 0 0 49 
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方程如 = K 无解，因此 K 不属于 Col A . 

2. 与练习题1相比，求 Nul A 的一个向量比判定一个给定的向量是否属于 Nul A 需要做更多的工作.但 
是，由于 A 已经是阶梯形，方程 Ar =0 给出如果 jc = ( 心 x 2 , x 3 )， 则 x 2 =0, x 3 =0, 士是自由变量.因此， 
Nul 的一个基是 v = ( l ，0,0). 求 Col 4 的一个向量是简单的，因为 A 中的每一列都属于 Col A . 此外， 
同一个向量 V 既属于 Nul A , 又属于 Cd A . 对大部分矩阵面言，只有零向量是既属于 Nul A ，又属 
于 Col A . 

3. 如果 A 是可逆的，则根据可逆矩阵定理， A 的各列生成 R ' 由定义可知，任何矩阵的列总是可以生成 
该矩阵的列空间，因此这里 Col A 就是全部的 IT . 用符号表示就是 Col A = R n . 同时，因为 A 是可逆 
的，方程如= 0只有平凡解.这意味着 Nul A 是零子空间，用符号表示就是 Nul A = {0}. 

2.9 维数与秩 

本节从坐标系的概念开始对子空间和子空间的基继续加以讨论.下面的定义和例子使一 
个有用的新术语 —— 维数， 显得非常自然，至少对 K 3 子空间是这样. 

坐标系 

选择子空间 W 的一个基代替一个纯粹生成集的主要原因，是//中的每个向量可以被表示 
为基向量的线性组合的惟一 形式. 为了明确原因，假设6 = {私是//的基，//中的一个 
向量 x 可以由两种方式生成，设 

JC = q 办 1 +〜 + C p 办 p ,且 X = 本办 ,十…+心 办 p (1) 

则相减得到 

0 = x_x = (c, _ 本 ) 办 i +〜 + (c p (2) 

因为 6 是线性无关的， （2) 中的权值必全为零.亦即对 1< J /彡 p ， cj = dj , ( 1 ) 式中的两种表 
示实际上是相同的. 

定义假设6 = { 私 是子空间//的一组基，对//中的每一个向量 X ，相对于基 S 的 
坐标是使 jc = cA + … + c p \ 成立的权值 c , ，…， c p ， 且 IT 中的向量 

c ' 

[x] B =: 

.V 

称为 x (相对于 S ) 的坐标向置，或 JC 的6-坐标向置戶 


© 要注意 B 中向量的次序，因为 [; c ] s 的元素依赖于 B 中向量的次序. 



154 


第 2 聿 


「 3 1 「―1 [ 3 1 

例1设 V,= 6 , v 2 = 0 ,JC= 12 ,B = { v „ v 2 }. 则因 v ,， v 2 线性无关， 6 是" sSpanfVbh} 


的基.判断 jc 是否在 H 中.如果是，求 jc 相对基 B 的坐标向量. 
解如果 X 在 H 中，则下面的向量方程是相 容的： 



'3' 


-1 


3 

Cl 

6 

+ c 2 

0 

= 

12 


2 


1 


7 


如果数 ChQ 存在，即是 X 的 S - 坐标.由行操作得 


「3 

-1 3] 


1 0 2 

6 

0 12 


0 1 3 

2 

1 7 


0 0 0 


「21 

于是(： | =2， < : 2 =3，【*〗 1! = 3 . 基确定 好上 的一个••坐标系”，如图 2-28 中的格子所示. 



图 2-28 R J 中一个平面《的一个坐标系 

注意到虽然中的点也在中，它们完全由属于 K 2 中的坐标向量确定_图 2-28 中的平 
面上的格子使看起来像 R 2 • 映射 JC h 4[ x ] B 是//和 R 2 之间保持线性组合关系的 一一 映射. 
我们称这种映射是同构的，且》与 R 2 同构. 

一般的，如果6 = {私，… ，心} 是 H 的基，则映射 jch [ jc ] b 是使和 IT 的形态一样的——映 
射（尽管中的向量可能有多于 p 个元素 > .( 详细的讨论见 4.4 节 .） 


子空间的维数 

可以证明，若子空间//有一组基包含 P 个向量，则《的每个基都正好包含 p 个向量，（见 
习题27和28 >,于是下列定义是有意义的. 

定义非零子空间的维数，用 dim // 表示，是 /f 的任意一个基的向量个数.零子空间 
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{0} 的维数定义为零. 0 

M " 空间维数为 / I , 1 T 的每个基由 n 个向量组成. R 3 中一个经过0的平面是2维的，一条 
经过0的直线是一维的. 

例2回忆 2.8 节例6中矩阵 A 的零空间有一个基包含3个向量.因此这里 Nul A 的维数为 
3. 观察到每个基向量对应方程如= 0的一个自由变量.我们的构造方法总是以这种方式产生一 
个基因此，要确定 NulA 的维数，只需求出如= 0中的自由变量 个数. ■ 

定义 矩阵 A 的秩（记为 rankA ) 是 A 的列空间的维数. 

因为的主元列形成 ColA 的一个基， A 的秩正好是 A 的主元列的个数. 

例3确定矩阵的秩 

"2 5 -3 -4 8' 

4 7-4-3 9 

A= 6 9 -5 2 4 

0 -9 6 5 -6 

解简化 A 成阶 梯行： 



矩阵 A 有3个主元列，因此 rankA = 3. ■ 

从例3的行化简可见在如= 0中有两个自由变量，因为 A 的五列中有两列不是主元列.（非 
主元列对应于如= 0中的自由变量 .） 由于主元列的个数加上非主元列的个数正好是 A 的列数， 
Col A 和 Nul A 的维数有如下有用的关系.（详细内容见 4.5 节的秩定理 .） 

定理 14 (秩定理） 

如果一矩阵 A 有 /I 列， I'J rank A + dim Nul A = n . 

下面的定理在应用中很重要，并在第5章和第6章中用到.该定理（在 4.5 节中证明）当 
然是很显明的，若你想到 p 维子空间同构于 IT . 由可逆矩阵定理知， IT 中的 p 个向量线性无 
关，当且仅当这 p 个向量也生成 IT . 

定理 15 (基定理） 

设 W 是 1 T 的 p 维子空间， W 中的任何恰好由 p 个成员组成的线性无关集构成 W 的一个基. 
并且， W 中任何生成 W 的 p 个向量集也构成 W 的一个基. 


零子空间无基 （ 因为零向量本身构成一个线性相关集）. 
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秩与可逆矩阵定理 

各种与矩阵相关的向量空间的概念为可逆矩阵定理提供了更多的命题.下面给出 2.3 节原 
定理的后续命题. 

定理（可逆矩阵定理（续 ）） 

设 A 是一 zjx / j 矩阵，则下面的每个命题与 A 是可逆矩阵的命题 等价： 

m . A 的列向量构成 IT 的一个基. 

n . ColA = M ". 

o . dim Col A = n . 

p . rank A = n . 

q . NulA = {0}. 

r . dim Nul A = 0. 

证根据线性无关和生成的概念，命题 （m ) 逻辑上与命题 （e ) 和 （h ) 等价.其他五个 
命题通过简单推导以如下关系与定理以前的命题 相连： 

( g )=>( n )=>( o )=>( p )=>( r )=>( q )=>( d ) 

命题 （ g ) 认为方程如=6对每一属于 IT 的6有至少一个解，由此可以推出 （ n )， 因为 Col A 确 
实是所有6的集合，满足方程如= 6相容的条件.命题 （ n ) ( 0 ) ( P ) 是因 为维数 和秩的 
定义.如果 A 的秩是 n ， 即 A 的列数，则根据秩定理得 dim Nul A = 0，因而 NulA = {0}. 于是有 
( p ) ^ (D ^ ( q ) . 同时，由命题 （ q ) 推出方程如= 0只有平凡解，即命题 （d ). 因为已知 
命题 （d ) 和 （g ) 与 A 是可逆矩阵的命题等价，从而定理证毕. ■ 

数 值计算 的注解 本教材中讨论的许多算法有助于概念的理解和手工进行简单的计 
算.然而这些算法通常不适于处理现实生活中的大规模问题. 

计算秩的算法是一个很好的例子.表面上看将矩阵简化为阶梯阵后数主元是很容 
易的事情.但除非是对元素精确指定的矩阵进行算术运算，行运算可以明显改变一个 

矩阵的秩.例如，假如矩阵=中 x 的值在计算机中不是存为7,那么它的秩可能是 
1或2，取决于计算机是否视 x -7 为零. 

在实际应用中，通常使用 A 的奇异值分解有效地确定矩阵 A 的秩，在 7.4 节中将 
会讨论. 

练习题 

1. 确定由向量 vtv , 生成的 R 3 的子空间的维 数. （首先找 tf 的基 .） 



■2 


' 3' 


-1* 


-8 

， v 2 = 

-7 

， v 3 = 

6 


6 


一 1 


-7 



2 . 贝 2 的基若％= ㈤ ， x 是 什么？ 

3. R 3 是否可能包含4维子空间？为什么？ 

习题 2.9 


习题1~2给出坐标向量 【 jc ] b 和基求向量 jc . 
像练习题2 - 样用 图示说明你的答案. 



习题3~6中， * 属于一个基为石=他,》 2 }的子 
空间 W, 求出 * 相对于 S 的坐标向量. 

3 - fc,= [m=[i] 

4 - fc,= [4 ftj= [l] >x= ["3 



{ft,A} 计算 * 来验证 W»- 



8 设 

B = { bM - 使用图形估算 [x] B ,[：y] B *[ Z ] B _ 用 
你估算的 [j] B ,[z] B 和 {ft,A} 计算 ymz 来验证 



习题 9~12 给出矩阵 A 及其阶梯阵，求 ColA 和 
NiilA 的基，并求其维数. 

■1-3 2 [1 -3 2 ^4' 

„ -3 9 -1 5 0 0 5 -7 

9. A = - 

2 -6 4 -3 0 0 0 5 

12 2 7j [0 0 0 0 

「 1 - 2 9 5 4] 



12-50 - 1 . 
0 12 4 5 

0 0 0 1 2 

0 0 0 0 0 
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12-43 


[-2 -4 5 0 -6」 

2 -4 3 3' 

00 1-2 0 

~ 0 0 0 0 -5 

0 0 0 0 0 

习题13〜14中，求给定向量生成的子空间的一 
个基及该子空间的维数. 



15. 设 一 3 x 5 矩阵4有三个主元列.是否 ColA = 
M 3 ? 是否 NuM = M 2 ? 解释原因. 

16. 设一 4 x 7 矩阵有 三个主 元列.是否 ColA = 
M 3 v N U 1 A 的维数是多少？解释原因. 

习题17〜18中，标出每个命题的真假，给出理 
由.这里是 mxn 矩阵. 

17. a . 若 6 = { v „ …， v p } 是子空间 H 的一个基， 

x =C,V, +... + CpVp ,则 C, ， ... ， C p 是 X 相对基 
S 的坐标. 

b . M " 中的每一直线是一维的 IT 子空间. 

C . Cola 的维数是 A 的主元列的个数. 

d . Col / l 和 NulA 的维数之和等于 A 的列数. 

e . 若 p 个向量生成 M " 中的 p 维子空间 H ，则 
这 P 个向量构成 H 的基. 

18. a . = 是子空间 H 的一个基，则 

H 中的每个向量可以写成 S 中向量的惟一 
线性组合形式. 

b . 若石=卜,，…， v p } 是 M " 中的子空间 H 的基， 
则映射 ; c 4 U ] B 使//和 M p 的形态一样. 

c . NulA 的维数是方程处= 0中的变量个数. 


d . A 的列空间的维数是 rankA . 

e . 若 H 是 r ■中的 P 维子空间，则 H 中的 P 
个线性无关向量组成的集合构成 H 的基. 

在习题19~24中，给出回答的证明或构造. 

19. 若 At =0 的解空间有一个由3个向量组成的 
基， A 为 5 x 7 矩阵， A 的秩是多少？ 

20. 若 4 x 5 矩阵的零空间是3维的，它的秩是多 
少？ 

21. —个 7 x 6 矩阵4的秩是4, At =0的解空间维 
数是多少？ 

22. 证明若5个向量生成 R " 中的5维子空间，则 
它们线性无关. 

23. 构造一个 dim NulA = 2 和 dim ColA = 2 的 3 x 4 
矩阵. 

24. 构造一个秩等于1的 4 x 3 矩阵. 

25. 设一 nxp 矩阵 A 的列空间是 p 维的，解释为 
什么 A 的列向量一定线性无关. 

26. 假设 A 的第1，3, 5和6列向量线性无关（但 
不必是主元列）且 A 的秩是4,解释为什么这 
4个列向量一定是 >4的列空间的一个基. 

27. 假设向量 b , ，… , b p 生成一个子空间 W ， 
{4, 是任一 W 中包含多于 p 个向量的向 
量集，完成下面的论述，证明{/!,，...，&} 一定 
是线性相关的.首先记 B = [私… b p \A = 
[fli … a ,3. 

a . 解释为什么对每一向量，存在一个 R p 中 

的向量使得+ = . 

b . 设(: = [ C , … C ,]， 解释为什么存在一个非 
零向量 H 使得 01 = 0. 

c . 使用 B 和(:证明 Ah = 0，从而证明 A 的列 
向量是线性相关的. 

28. 使用习题27 证明： 如果_4和6是 R " 中一子空 
间 W 的基，则乂不可能包含比6更多的向量， 

相反地， S 也不可能包含比乂更多的向量. 

29. [1^]设//=5 ? 31^ 1 ， 1 ； 2 }，0 =卜 1 ^ 2 },证明 1 属于 
H ,并求 x 相对6的坐标向量. 
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•11 


'14 


"19" 


-6 


8 


-9 


' 4 


_5 


-8 


-13 


4 


-3 


5 


1 

Vi = 

10 

， v 2 = 

13 

,x = 

18 

Vi = 

-9 

, v 2 = 

7 

， v 3 = 

-8 

,x = 

-8 


7 


10 


15 


4 


-3 


3 


3 


30. [ M ] 设 证明 B 

是 W 的基， jc 属于 W ，并求 I 相对 B 的坐标向 


练习题答案 

1 . ^JtA = [ v , v 2 v 3 ], 使由生成的子空间是 A 的列空间.这一空间的一组基是 A 的主元列. 


" 2 3 -l 


•2 3-1 


2 3 -1" 

-8-7 6 


0 5 2 


0 5 2 

6-1-7 


0 -10 -4 


0 0 0 


由此/!的前两列是主元列，构成《的基，所以 dim //=2. 



2 . 若 W B 


.，则 


* 是基向量的线性组合，权为3和 2. 


x = 3 ft , + 2 ft 2 



基 { ft , 确定 K 2 的坐标系，在图中用格子表示.注意 x 在 fc , 方向是3个单位，方向是2个单位. 



3. 4维空间包含一个有4个线性无关向量的基，这在 R 3 中是不可能的.因 K 3 中任意线性无关集不超过3 
个 向量. R 3 中任意子空间的维数不超过3,空间 R 3 本身是 K 3 仅有的3维子空间.其他子空间的维数 
为2, 1或 0. 
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给定 K" 中 _y = (>>,，>%".，凡），设『中 c = (c 0 , 
cu …， c„_0 满足 Vc = _y ，定义多项式 
p(/) = c 0 + c,/ + c 2 / 2 + ••• + c„^r' 

a. 证明 p{x^)=y l ,p{x 1 ) = y 1 , -,p{x n ) = y n , 称 
P ( t ) 为点 U ，: y ,) y „) 的插值多项式， 
因 p(0 的图像通过这些点. 

b . 设 u 2 , …， a 为相异的数，证明 K 的列是线 
性无关的.（提示 ：一个 n-1 次多项式至多 
能有多少个零点？） 

C. 证明：若; c, ， ... ， ;c„ 为相异的数，而 y,， …,; 


第2章补充习题 


设在以下命题中提到的矩阵有适当的维数.标 
出各个命题的真假，给出理由. 

a . 若和 S 都是 mxn 矩阵，则 AB T 和都 
有定义. 

b . 若 = C ■而 C 有 2 列，则 A 有 2 列. 

c . 将矩阵 S 以对角元素非零的对角矩阵 A 左 
乘，等于对 S 的各行进行标量乘法. 

d . 若 BC = BD ，则 C = D . 

e . 若 AC = 0 , 则 A = 0 或 C = 0 . 

f . 若九 fl 都是 nxn 矩阵，则 04 + S ) 04 - S ) = 
A 2 - B 2 . 

g . 一个初等矩阵有《或《 + 1 个非零元素. 

h . 初等矩阵的转置也是初等矩阵. 

i . 初等矩阵必定是方阵. 

j . 每个方阵是初等矩阵的积. 

k . 若 4 是 3x3 矩阵，有 3 个主元位置，存在 
初等矩阵 E u …，五尸使 …= / . 

l . 若从=/,则 4 可逆. 

m . 若 4 和 S 是可逆矩阵，则灿可逆且 （ AB)— 1 
= A'B'. 

n . 若 = 且可逆，则/ 1 _| 召=& 4 _1 . 

0 . 若可逆且以 0 ,则 


p. 若4是 3x3 矩阵且方程舳: 


有惟一解, 


则4可逆. 

2. 求矩阵(:使 (T 1 : 


"4 5" 
6 7 


证明 /=0, 利用矩阵代赛 


"0 0 0 " 

3. 设1 0 0 

0 1 0 
计算乘积 (/-4)(/+ 4 + /). 

4. 设对某个《>1， A"=0, 求/-4的逆. 

5. 设 nxn 矩阵4满足方程 f-2/4 + / = 0, 证明 
A 3 =3 A -2 I , A 4 =44-3/. 



*1 3 

8. 


-3 5' 

设4= 

2 4 

11 


15 


1 2 

5 


3 4_ 


6. a A = ^ _ij ,S = [i o] ? 它们是 Pauli spin 矩 

阵，在量子力学的电子旋转研究中有 应用. 证 
明： >4 2 =/， S 2 =/ ，且 AB = -&4, 矩阵满足 AB = 
称为负交换的. 


不通过计算^ 

求 fS . (提 示： 是方程 AX=fi 的解 .） 

8. 求矩阵4使变换； r 4舳把和分别变为 

提示： 写个包含矩阵4的方程，并 
把它解出来 .） 

9 . 设 AB = [j ;]， S = [ 7 2 ;]， 

10. 设4可逆.说明为什么 AM 也可逆，然后证明 
A' 1 =( A T A )~' A T . 

11. 设; c,， …，; c„ 为固定的数，下列矩阵称为范德蒙 
德矩阵，在信号处理、纠错码以及多项式插值 
中都有应用. 


[;卜卟 


VV … c 

w … 

>f H2 … H” 
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任意数，则存在一个过点 
且次数次的插值多项式. 

12. SA = Lf/， 其中 L 是可逆下三角矩阵， f/ 是 
上三角矩阵，说明为什么>1的第一列是 Z •的第 
一列的倍数.>1的第二列和 i 的列有何关 
系？ 

13. 给定《属于 R"，« T II = 1, 设/• = « 〆 (外积)， 
而2 = /-2/>, 证明： 

a. P 1 = P b. P r = P c. Q 7 =I 

变换 jch ft: 称为一个投影， jth » Gx 称为 
豪斯霍尔德反射.这样的反射在计算机程序 
中用来在一个向量 （ 通常是矩阵的列）中产生 


更多的零. 



0 


T 

14. 设《 = 

0 

和 JT = 

5 


1 


3 


，确定如习题13中的尸和 


G 并计算朽和 G * ， 图 2-29 说明 Gx 是X关于 
jc ,A 平面的反射. 

15. 设 C = £ 3 £ 2 £,fl, 其中£„£ 2 ,£ 3 是初等矩阵，说 
明为什么 C 行等价于 


16. 设 A 是 nxn 奇异矩阵，如何构造一个 nxn 非 


零矩阵 B 使灿= 0? 

17. 设 A 是一 6x4 矩阵， fl 是一 4x6 矩阵，证明 
6x6 矩阵 AS 不可逆. 



18. 设 A 是 5x3 矩阵，存在 3x5 矩阵 C 使得 
CA = h, 又设对 R 5 中某个 A, 方程处=»有 
至少一个解，证明方程的解是惟一的. 

19. [M] 某些动力系统可借助矩阵的幂来研究，如 
下所示.给定下列矩阵 A 与确定当 it 增加 
时（例如 ), ^与#有何变化，识 
别 a 和 b 有什么特点？研究类似矩阵的幂，提 
出关于这类矩阵的猜想. 



[0.4 

0.2 

0.3* 


0 

0.2 

0.3" 

A = 

0.3 

0.6 

0.3 

, B = 

0.1 

0.6 

0.3 


0.3 

0.2 

0.4 


0.9 

0.2 

0.4 


20.[\1〗设4 1 为/^/ 1 矩阵，主对角线各元素为0而 
其他元素为 1. 对 n = 4,5,6计算 AT 1 , 对值更大 
的提出关于一般的 AT 1 的猜想. 
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介绍性实例解析几何中的行列式 


行列式是一个数.它由一些数字按一定方式排成的方阵所确定. 
这个思想早在1683年和1693年就由日本数学家关孝和与德国数学家 
莱布尼茨提出，大约比形成独立体系的矩阵理论早160年.多年以来， 
行列式主要出现在线性方程组的讨论中. 

在1750年，瑞士数学家克拉默写了一篇文章指出行列式在解析 
几何学中很有用处.在那篇文章中，克拉默使用行列式构造叮平面中 
的某些曲线方程组.而且他给出了著名的用行列式求解 /JX/1 方程组 
的克拉默法则.随后在1812年，柯西 （ Cauchy ) 发表了一篇文章， 
文中他使用行列式给出计算多个多面体体积的行列式公式，并将这些 
公式与早期行列式的工作联系起来.在柯西研究的"水晶体”中有图 
3-1 的四面体和图 3-2 的平行六 面体. 若平行六面体的顶点是原点 
0 = (0,0,0), v , = ( fl „ fc ,, c ,), K 2 = ( fl 2 , fe , c 2 ),»>3 = ( fl 3 A ， c 3 ) ,则它的体积是下 
面的线性方程组的系数矩阵的行列式的绝对值. 



a , x + b l y + c x z =0 
a 2 x+b2y+c 2 z=0 
aiX+b3y+c 3 z = 0 


柯西在解析几何中使用行列式的工作激发了人们对行列式应用的强烈兴趣.持续了大约100年.有关 
这些内容的摘要可以在20世纪初由米尔 （Thomas Muir ) 写的四卷论著中査到. 




图 3-1 四面体 


»3 

图 3-2 平行六面体 


在柯西的年代，人们生活简单，矩阵规模不大，行列式在解析几何和数学其他分支中都起着重要的 
作用.现在，虽然行列式对经常岀现的大规模矩阵计算面言不具有太大的数值意义，但是行列式公式仍给 
岀关于矩阵的重要信息，并且行列式的知识在线性代数的一些应用当中是很有用的. »»»» 

本章有三个 目标： 对方阵证明 A 可逆的判别准则，这与 A 的元素而不是 A 的列 有关； 
给出计算， 1 和， A 的公式，这在理论上是有 用的； 导出本章介绍的行列式的几何解释.第一个 
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目标在 3.2 节中完成，另两个目标在 3.3 节中完成. 

3.1 行列式介绍 

针对 2.2 节中的结论，我们回顾一个 2 x 2 矩阵是可逆的，当且仅当它的行列式非零.为了 
将这个有用的结果推广到更大的矩阵，我们需要对矩阵的行列式给出一个定义_我们可以 
通过观察对一个可逆的 3 x 3 矩阵4做行化简时会出现什么结果来发现 3 x 3 矩阵的行列式的定义. 

考虑 4 = k y ], a „^0, / i 的第二行和第三行都乘以 ail ， 然后再分别减去第一行适当的倍数， 
则4行等价于下面两个 矩阵： 


a n fl 23 I "- 1 0 a n a 2 2 ~ ct i 2 a 2i - ai 3 a 21 

a n a 32 a n a 33 」[ 0 a n an -a l2 a 3 i a„a 33 一 
由于 4 可逆， （1) 式右边矩阵中（2,2)和（3,2)位置的值不同时为 0. 不妨假设 （2,2) 位置的 
值不，^零（否则，可以做一个行交换变成这种情 形）. 第三行乘以 flllfl 22 - fl , 2 办，再对这个新 
的第三行加上第二行乘以 -( a 11 a 32- a 12 a 3 ,) ,这样就有 


0 ^ 11^22 ~d\2d2\ 

0 0 


^13 


anA 


这里 


A = 01)022^33 + ^12023^31 +013^21^32 一屮1办山2 ~ ^12^2^33 ~ 013^22^31 ( 2 ) 

由于4可逆 ， A —定不等于零.反之亦然，我们将在3. 2 节中看到这个结论.我们称 （2) 式中 
的 A 为 3 x 3 矩阵4的行列式. 

回忆 2 x 2 矩阵4 = [%]的行列式，即.对 lxi 矩阵，如^^"]，定义 
detA = « M . 为了将行列式的定义推广到更大的矩阵，我们将利用 2 x 2 行列式来重写上面叙述的 
3 x 3 行列式 A . 因为 A 中的项可以写成 


(auana 33 -<21,023032)-(012021033 -012023031) + (013021032 -ana^a^) 



为了简单，可写成 

A = a" detA,i ~a n - det A n +ai 3 - det A l3 ( 3 ) 

这里， A ” As 由 4 中划去第一行和三列中之一列而 得到. 对任意方阵4，令4表示通过划 
掉4中第* 行和第 y 列而得到的子矩阵，比如，若 

「1 -2 5 0] 


L 0 4 -2 0」 

则烏 2 通过划掉第三行和第二列而得到 
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"1 -2 5 0" 

2 0 4 -1 

3 10 7 
0 4-20 

即 

"1 5 0' 

A 32 = 2 4 -1 

0-2 0 

现在我们可以给出行列式的一个递归定义.当 n = 3 时，像上面的 （3) 式， detA 由 2x2 子矩阵 
的行列式来定义.当 n = 4 时， detA 由 3x3 子矩 阵心来 定义.一般情形，一个《乂《行列式由 
(«-l)x(〃-l) 子矩阵的行列式来定义. 

定义当彡2，矩阵 A = [ a , y ] 的行列式是 形如士 detA ; 的《个项的和，其中加号和减 
号交替出现，这里元素 flll ， fll 2 ，…〜来自 A 的第一行，即 

deti4 = a n det A n - a 12 .det A 12 +... + (-l) ,+fl a In -detA n 

=J(-l) I+ ^ u detA u 


例 1 计算行列式 deM ， 其中 

"1 5 O' 

A= 2 4-1 

0-2 0 

解计算 det A = a n det ~ a i2 - det A I2 + a , } - det A I} . 
det A = 1 ■ det 



=1(0 - 2) - 5(0 - 0) + 0(-4 - 0) = -2 ■ 

方阵的行列式的另一个常用记号是利用一对竖线代替括号.这样，例1中的运算可以写成 



为了叙述下一个定理，将 detA 的定义用稍微不同的形式写出是很方便的.给定4 = [~], 4 
的 (/, y) 余因子 Q 由下式给出 


Q=(-l) i+J detA, (4) 

则 det A = an ■ Cn + a I2 - C ^ + + - Ci „ 

这个公式称为按 /i 的第一 行的余因子展开式， 为了避免冗长的陈述，我们省略下面基本定理的 
证明. 


定理1 矩阵 A 的行列式可按任意行或列的余因子展开式来计算.按第/行展开用 (4) 

式给出的余因子写法可以 写成： 
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按第 j 列的余因子展开式为 

dct A = Q\ jC\j j + . • ‘ + G/y.C n j 

(/， 乃位 置的余因子中加号或减号取决于％在矩阵中的位置，而与％本身的符号无关，因 
子 (-1)^ 可确定下面符号的棋盘 模式： 


例2利用按第三行的余因子展开式求 detA ， 其中 


解计算 


1 5 

A= 2 4 

0 -2 


O ' 

-1 

0 


deM = a 31 C 31 + a 32 C 32 + ^ 33^33 

= (-l) 3 + 1 a 3 i detA 31 +(-l) 3 + 2 a 32 detA 32 +(-l) 3 + 3 a 33 detA 33 

H : — H 4| =o+2( - i)+o= - 2 ■ 

定理 1 有助于计算包含有许多零的行列式.例如，如果某行多数元素为零，则按此行的余 
因子展开式就会有许多项为零，这些项中的余因子就不需计算.同理对多数元素为零的某列也 
是这样. 


例3计算 detA ， 这里 


"3 -7 8 9 -6' 

0 2 -5 7 3 

A = 0 0 1 5 0 

0 0 2 4 -1 

0 0 0 -2 0 

解按 A 的第一列的余因子展开式中，除第一项外均为零，从而 


detA = 3- 


"2 -5 7 

0 1 5 

0 2 4 

0 0-2 


3' 

0 

, -0.C 21 + 0.C 31 -0.C 41 + 0.C 51 
-1 

0 


接下来在余因子展开式中省略零项，再利用第一列零的优势，按第一列展开这个 4 x 4 行列式，有 


*1 5 

detA = 3.2. 2 4 

0-2 


O ' 

-1 

0 



行列式 ___ 

这个 3 x 3 行列式已在例1中算出结果为 - 2 , 从而 deM = 3’2_(- 2 ) = -12 ■ 

例 3 中矩阵接近三角阵，此例中的方法容易用来证明下面的定理 • 

定理2 若 4 为三角阵，则 detA 等于 4 的主对角线上元素的乘积. 

当某行或某列全为零时，例 3 中找零的策略效果特别好，在这种情形下，按这一行或列的 
余因子展开式是一些零的和，从而此行列式为零.但不幸的是，大多数的余因子展开式并不是 
这样快能求值的. 

数值计算的注解 按现在的标准来说，一个 25 x 25 矩阵还是小的.但是用余因子展开 
式来计算一个 25 x 25 行列式是不可行的.一般对行列式而言，余因子展开式需要 
计算超过《!个乘法运算， 25! 近似于 1 . 5 x 10 25 . 

若一个超级计算机每秒钟能够完成 1 万亿次乘法运算，用这种方法计算一个 25 ><25 
行列式，它将需运行 50 万年.幸运的是，稍候我们就会发现快速计算的方法 - 
在习题 19 〜 38 中，多数是 2 x 2 情形的矩阵，揭示了行列式的一些重要性质.习题 33 〜 36 的 
结果将用来在下一节导出矩阵的与之相似的性质. 


练习题 


5 -7 2 2| 


计算 


0 3 0 -4 

-5-8 0 3 

0 5 0 -6 


习题 3.1 

利用第一行的余因子展开式计算下列1~8题 
中的行列式.按第二列的余因子展开式再次计算 
1~4题中的行列式. 


4 3 0 
6 5 2 


4 -3 0 
2 4 l | 

1 3 5[ 


5-2 4 

0 3-5 


利用余因子展开式计算9~14题中的行列式, 


在每一步，选择使得计算量最少的行和列. 



一个 3 x 3 行列式的展开式可由下列方法记忆, 


在矩阵的右边分别再写出矩阵的前两列，通过先算 
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出六个对角线上数字的乘积，然后箭头向下的三个 
对角线上数字的乘积相加再减去箭头向上的三个 
对角线上数字的乘积就算出了这个行列式.用此 
法计算15~18题中的行列式. 


// / 



注意，这种方法不能推广到 4X4 或更大的矩阵. 


15. 



16. 


0 5 1 
4-3 0 
2 4 1 


|1 3 5| 


17. 3 


1 2 
4 -1 


18. 


2 1 1 
3 4 2 


在习题19 〜 24 中，考察矩阵的行列式在初等行 


变换下的变化.对每一个情形，说出是何种行变 
换，再说出此变换对这个行列式有何影响. 



21 - [s Ms 二 6 + \k_ 


b a-^kc b + kd 
d \ J \_ c d 



111" 


\ k k k 

23. , 

-3 8 -4, 

.1 

-3 8 -4 

1 

_ 2 — 3 2」 

1 

_ 2 -3 2_ 



r« b c \ 

I 

'3 2 2 

24. 

3 2 2 

， 1 

a b c 

1 

- 6 5 6」 

1 1 

6 5 6 


计算习题 25-30 给出的初等矩阵的行列式(见 
2.2 节）. 


25 . 

'1 0 0" 

0 0 

26. 

"1 0 o ' 

0 1 0 


0 k Ij 


k 0 1 



>00 


"1 0 O ' 

27. 

0 1 0 

28. 

0 k 0 


0 0 1 


0 0 1 


0 1 0 


0 0 r 

29. 

1 0 0 

30. 

0 1 0 


0 0 1 


10 0 


利用 25-28 题回答习题31和习题32中的问 
题，给出答案的理由. 

31. 初等矩阵经过行替代 （ 即行倍加），其行列式 
是什么？ 

32- 对角线上某元素乘* :的 初等矩阵的行列式是 
什么？ 

在33~36题中，证明 detfiAydetfiXdet / l ). 这 
里 S 为给出的初等矩阵 ， A = P *1. 


33. 




34. I 

「1 0 1 


L 1 

0 」 


1 

.0 k\ 

35. 

[: 

:] 


36. I 



U 


1 


37. 


[: 

ij' 

, 写出 54 ， det5A = 5det/l 吗？ 

38. 

A= \ 

[: 

3 

，灸为一个数 , 

找出 detfc4 与 /t 和 


detA 相联系的公式. 

在习题39和习题牝中，4为 nxn 矩阵，标 
出每个命题的真假，验证每个回答. 

39. a . —个 nxn 行列式由子矩阵的 

行列式所定义. 

b . 矩阵4的 （ Z ， y ) 余因子是4中划掉第 /行和 
第 j 列所得到的矩阵 4. 

40. a . det 4 的按某列的余因子展开式是按某行展 

开式的 -1 倍. 

b . 三角形矩阵的行列式等于主对角线上元素 
之和. 

41. 若 “ = [^ j ， v = [; j ，计算由《 ， v ，《 + v *_ 
成的平行四边形的面积，再计算 [„ V] 的行列 
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式，二者相比较，结果如何.将 V 的第一个数 
字换成任意数 X ，重复考虑上面的问题，画一 
个图并解释你的发现. 

42. 令 m = ^j , v = ，这里 a > ， c 是正数（为了 

简单起见），计算由 《， v ，《 + v 和0构成的平行 
四边形的面积，再计算 [« v ] 和 [v «] 的行列式， 
画一个图并解释你的发现. 

43. [ M ] det(A + B ) = detA + detB 对吗？为看封结果 
是否正确，随意给两个 5 >< 5 矩阵 A ， B ，计算 
det(A + S )- detA - detB ( 参考 2.1 节中习题 37). 
对另外3对不同的 nxn 矩阵，重复上述计算， 
报告你的结论. 

44. [ M ] det AB = ( detA )( detS ) 对吗？像《 题一样用 


4对随机矩阵来检验，并给出一个猜想- 

45. [M] 随意构造一个元素均为从 -9 到 9 的整数的 
4 x 4 矩阵，计算 detA ， det 4 T ， det (- A ) , det (2 A ) 
和 det ( l ( M ). 对另外两个随机的収 4 整数矩阵 
重复以上计算，给出这些行列式之间关系的一 
个猜想.（参考 2.1 节习题3 4 .)用几个随机的 
5 x 5 和 6 x 6 整数矩阵来检验你的猜想，若有必 
要的话，修正你的猜想，报告你的结果. 

46. [ Mjdet / T 1 与 detA 关系如何？用随 机的^ 整 
数矩阵来检验 (n = 4,5,6). 并做出猜想. 

注： 万一你遇到 det 4 = 0 的情形，化简矩阵 A 
成阶梯形的情形，再讨论你的发现. 


练习题答案 

充分利用0,开始先按第3列的余因子展开成为3阶行列式’对此再按第一列 展开： 
0 3 


5-7 2 
0 3 0 

-5-8 0 
0 5 0 -6 i 


=(- 1) ,+3 . 2 


-6 


■ 20 


计算中倒数第2步中的(-1) 2+1 是由 3 x 3 行列式中 -5 的(2，1)位置决定的. 


3.2 行列式的性质 


行列式的奥秘在于当做行变换时它如何变化.下列定理推广了 3.1 节中3题19~24的结果， 
其证明在本节末尾. 

定理3 (行变换） 

令 A 是一个方阵. 

a . 若4的某一行的倍数加到另一行得矩阵 B ， 则 detB = deM . 

b . 若 A 的两行互换得矩阵 B , 则 detB = - detA . 

c . 若4的某行乘以 ife 倍得到矩阵 B , 则 detB = ldetA . 

下列例子展示如何利用定理3来有效地计算行列式. 

"1-4 2 

例1 计算 det / i , 其中4= -2 8 -9 _ 

-1 7 0 

解 思路是先将^化简成阶梯形，再利用三角形矩阵的行列式等于对角线上元素之积的知 
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识.针对第一列的前两次行倍加均不改变行列式的值. 
det A = 

交换第2行与第3行使行列式取反号，即 


1 -4 2 


1 -4 2 


1 -4 2 

-2 8-9 

= 

0 0—5 

= 

0 0-5 

-17 0 


-17 0 


0 3 2 


det A = — ! 


0 3 2 

|o 0 - 5! 

计算行列式时，通常利用定理 3( c ) 将某一行的公因子提出来 ，如： 


-4 


:-(1)(3)(-5) = 15 


* 

* * 


氺 

氺氺 

5 k 

- 2 k 3 k 

=k 

5 

-2 3 

氺 

* * 


* 

* * 


这里用星号标记的元素不变.在下例中用此方法 
2-8 6 8 


例 2 计算 deM, 这里 4: 


3 -9 5 10 
-3 0 1-2 

1-4 0 6 

解为简化计算，设法使左上角为1，可将第1行与第4行交换，也可由第1行提出因子 
2,再对第1列做行 倍加： 



1 -4 

3 

4 


1 

-4 

3 

4 

deM = 2 

3 -9 

5 

10 

= 2 

0 

3 

-4 

-2 


-3 0 

1 

-2 


0 

-12 

10 

10 


1 -4 

0 

6 


0 

0 

-3 

2 


然后，可再从第3行中提出2,或利用第2列中的3作为一个 主元. 此处，我们用后者，将第2 
行的4倍加到第3 行： 

1-434 

J 3-4-2 

det A = 2 

0 0-62 
0 0-32 

最后，将 -1/2 倍的第3行加到第4行，再计算这个 “三 角形”行列 式得： 

1-434 

,, 3-4-2 
det A = 2 

0 0-62 
0 0 0 1 

若一个方阵4被行倍加和行交换化简为阶梯形 t / (这总是可以做到的，见 1.2 节行化简算 
法），且此过程经过了 r 次行交换，则定理3表明 


= 2. (1)-(3). (-6).(1) = -36 
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由于是阶梯形，它是三角阵，因此 detU 是主对角线上的元素 《 n ， …，‘的乘积.若 A 可逆， 
则元素〜都是主元（因为4~/„且％没有被倍乘变为1).否则，至少有等于零，乘积 
为零.见图 3-3. 

Tb * * *' 

0 ■ * * 

0 0 ■ * 

0 0 0 ■ 
det U 关 0 
■ « « «' 

0 ■ * * 

0 0 0 ■ 

0 0 0 0 
det U=0 

图 3-3 标准的阶梯形方阵 

从而有以下公式 

deM = {(-!/• ( t / 的主元乘积）当>1可逆 （i ) 

"jo 当>1不可逆 

注意到下列有趣的 情形： 尽管上述中的阶梯形 t / 是不惟一的（因为它并没有经过完全的行简 
化），主元也不是惟一的，但除了差一个负号外，这些主元的乘积是惟一的. 

公式 （1) 不但给出 detA 的一个具体的解释，还证明了本节的主要 定理： 

定理 4方阵 A 是可逆的当且仅当 detA 关 0. 

定理4把语句 “ detA ^ O ” 增加到可逆矩阵定理中.一个有用的推论是若4的列是线形相 
关的，贝 ljdet 4 = 0_ 而且若4的行是线形相关的，则 deM = 0. ( 4的行是 ，的 列，由 A T 的列 
线性相关可推出，是奇 异的. 当，是奇异矩阵时，由可逆矩阵定理可知，4也是奇异的 .） 在 
实际问题中，当两行或两列是相同的或者一行或一列是零时，则线形相关是显然的. 

3-12 -51 


例3计算 det 4，欠: 


0 5 

-6 7 

—5-8 


-3 -6 
-7 4 

0 9 


解将2倍的第1行加到第3行，得 


3-12-5. 
0 5-3-6 

0 5-3-6 

-5-8 0 9 
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这是因为第二个矩阵的第2行和第3行相等 • 


数值计算的注解 

1. 对一般的矩阵九许多计算 det A 的计算机程序使用上面公式 （1) 的方法_ 

2. 可以证 明一个行列式利用行变换展开大约需要2« 3 /3次算术运算，任何现 
代微型计算机可以在不到一秒钟内计算一个 25 x 25 行列式，因为仅需大约10000次 
运算. 

充分利用出现的多个零，利用特别的指令，计算机还可以处理大的“稀疏”矩阵.当然， 
零元素可加快手算过程.下例的计算中结合了行变换的优势和 3.1 节中余因子展开中利用零元 
素的技巧. 

' 0 

例4计算 detA , A = ^ 

_-2 

解 开始最好是利用第1列中的2作为一个主元，消去下面的 -2, 再利用余因子展开简化 
成低一阶的行列式，然后再由行倍加变换，有 
|0 1 2-1 


|0 0 -3 1 

交换第2行与第3行得到一个“三角形行列式”.另一种方法是按第1列的余因子 展开: 
detA = (-2)( l)M = = -2.(15) = -30 



1 2 

— 1 


1 2 -1 

=-2 

3 6 

2 

=-2 

0 0 5 


0 -3 

1 


0 -3 1 


1 2 - 1 " 

5-7 3 

3 6 2 

-5 4-2 


列变换 

类似于前面已经考虑过的行变换，我们可以对矩阵的列实行变换，下一个定理证明行列式 
的列变换与行变换具有相同的效果. 

定理5 若 4 为一个矩阵，则 deM T = detA . 

证明当 《 = 1 时，定理显然成立.假设定理对 ifexjfe 行列式成立.令《 = *: + 1,则4中化的余 
因子等于 ，中叫 的余因子，因为这些余因子是由 ifexife 行列式表示的，所以 detA 沿着第一行的 
余因子展开等于 det ^ 沿第一列的余因子展开，即 det/i = d e t > l T . 于是定理对 《 = + l 也成立， 
即定理对一个《成立就可以推出对 《 + 1 成立.由归纳法原理，定理对任意均成立. ■ 

因为定理5成立，所以当把定理3中出现的“行”字变成“列”字时，定理3中每一个命 
题均成立.为证此性质，只需针对应用原来的定理 3. 对的一个行变换相当于对4的一个 
列变换. 
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列变换对理论和手工计算都是很有用的.然而，为了简单，在数值计算中，我们仅实行行 
变换. 

行列式与矩阵乘积 

下列有用定理的证明放在本节末尾，其应用放在习题中. 


定理6 (乘法的性质） 

若 A 和 B 均为矩阵，则 det AB = (det A )( detB ) • 


例5 
解 


对 g ， B =^ 6. 


14 3 
2 


detAfi = 2513-： 


•14 = 325 - 280 = 45 


由于 det A = 9 ， det B = 5 ， 

(det A)(det B ) = 9.5 = 45 = det AB 

警告通常一个错误的观点是定理 6 对矩阵的和也有类似的结果.然而，一般而言， 
det(A + B ) 不等于 detA + detB . 


■ 


行列式函数的一个线性性质 


若4为《><«矩阵，我们可以将 detA 看作4中《个列向量的函数，我们将证明如果4中除 
了一列之外都是固定的向量，则 detA 是那个可变列向量的线性函数. 

假设4的第7列允许有变化，4可 写成： 


A = [ a , … a M x fl „] 

定义由 IT 到 r 的变换 r 为： 


则有 


r ( x ) = det [ fl , … a hX x a ", ••- aj 


T ( cx )= cT ( x ) , 对任意常数 c 和 R " 中任意 x 成立 （2) 

T(u + v ) = T ( u ) + T ( v ), 对 IT 中所有 《，v 成立 （3) 

性质 （2) 即定理 3( c ) 应用到4的列 .（3) 的一个证明可由 detA 按第列的余因子展开来 
完成 （ 见习题43 ). 行列式的这个线性性质有许多有用的推论，将会在髙级的课程学习中研究. 

定理3和定理6的证明 

借助于2. 2 节中讨论的初等矩阵证明定理3是方便的.我们称一个初等矩阵£是一个行倍 
加（矩阵），如果£是由单位矩阵/经一行加另一行的倍数而 得到； 称 £ 是一个交换，如果 £ 是 
由交换/的两行而 得到； 称£是一个 r 倍乘，如果£是由/的某一行乘以一个非零数量而得到. 
用这些术语，定理3可重新叙述 如下： 


若 A 是一个 nxn 矩阵，£是一个《><«初等矩阵，则 
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这里 

1 若 E 是 一个行倍加 
det £= -1 若 五是一 个交换 
r 若五是一个 r 倍乘 

定理 3 的证明 针对4的行或列的大小用归纳法， 2 x 2 矩阵的情形在 3.1 节中习题 33-36 
已证. 假设该定理对矩阵的行列式成立， k ^2. 令《 = &+1，4为矩阵.£对/1的作用 
涉及两行或一行.所以我们可以按在£的作用下没有被改变的一行展开 det £4， 比如说第；行. 
令4 ( 分别地，螞 ） 是由4 ( 分别地，£4 ) 中划掉第/ 行第 j 列得到的矩阵，则瑪的行由木的 
行通过实行与£作用 A 相同类型的初等行变换得到，由于这些子矩阵仅仅是 JtxJt 矩阵，归纳假 
设蕴涵 

detBy =adetAij 

这里 a = 1,-1 , r ， 依£的类型而定. det £4 沿第；行的余因子展开式是 
det £4 = a ( i ( — 1) ，+1 det Bn + … +〜(—1) ,+ " det B in 

=a a "(- l ) ,+1 det 烏 + … +a ‘ (-1 广 det 4 
=a • det A 

特别地，取/1 = / 11 ，则(161£ = 1,-1，/"，依赖于£的类型而定_于是定理对 《 = 2 成立.定理对 《 成 
立蕴涵对 n + 1 时也成立.由归纳法原理，定理对2均成立.对 《 = 1 时，定理显然成立. ■ 

定理 6 的证明 若4不可逆，由 2.3 节中习题27,则 从 也不可逆.在此情形下，由定理4, 
因 deM 和 deM . detB 均为零，则 deMS = ( deM )( detS ) 成立. 若4可逆，由可逆矩阵定理，4与 
单位矩阵/„行等价，所以存在初等矩阵£, ，…， £ p 使得 
A = 

为了简单，用|4|表示 det / l _ 反复应用定理3,如上面所重新描述的那样，得 

| AS 卜 |£ p … 叫 = |£ p |. IV , …卜… 

= 1心1__'叫如| = 〜 = |心_，斗|5丨 

=1^1 N ■ 

练习题 


1. 用尽可能少的步骤计算 

2. 用一个行列式来确定向量 Vl ， v 2 ， v 3 是否线性无关，这里 

-3 

3 
-5 




1-3 1-2 

2 -5 -1 -2 
0-451 
-3 10 -6 8 
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习题 3.2 

在习题 1~4 中，每个方程说明行列式的一个性 
质，叙述这些性质. 

|0 5 -21 


-3 

-1 

i2 -6 41 

3 5 -2| 

1 6 

1 3-4| 

2 0 -3 


1 -3 6 

0 5-2 

4-18 
1 -3 2 

3 5-2 

1 6 3 



5 

-4 


7 | 

|5 -4 


1 

2 

3 


12 3 

4. 

0 

5 

-4 

= 

；0 5 -4 


3 

7 

4 


0 1-5 


在习题 5〜10 中，通过行化简成阶梯形求行列 
式的值. 

5 -61 


-2 -7 

1 5 -31 
3 -3 

2 13 


13 0 2 

-2 -5 7 4 

3 5 2 1 

1-12-3 


8 . 


13 3-4 

0 12-5 

2 5 4 -3 

-3-7-5 2 


10 . 


1 3-1 0-2 

0 2 -4 -1 -6 

-2 -6 2 3 9 

3 7 -3 8 -7 

3 5 5 2 7 


9. 


1-1-3 0 
0 15 4 

-12 8 5 

3-1-2 3 


在习题 11〜14 中，结合行简化和余因子展开的 
方法计算行列式的值. 


11 . 


2 5-3-1 

3 0 1-3 

-6 0-4 9 

4 10 -4 -1 


12 . 


-12 3 0 

3 4 3 0 
5 4 6 6 

4 2 4 3 


13. 


2 5 4 1 

4 7 6 2 

6-2-40 
-6 7 7 0 


14. 


-3-2 1 

13 0-3 

-3 4-2 8 

3-404 


a b c 

求习题 15〜20 中的行列式，已知 d e f=l. 

8 h 


a b c a b c 

15. d e f 16. 3d 3e 3 / 

5^ 5h Si g h i 


17. 


a b 
8 h 


18. 


8 h i 
a b c 


19. 


a b c 

2d + a 2e + b 2/ + c 
8 h 


20 . 


a + d b + e 
d e 

8 h 


在习题 21 〜 23 中，利用行列式检验这些矩阵是 


否可逆. 


21 . 


23. 


'2 3 0" 

1 1 

*5 0 -1' 

1 3 4 


22. 

1-3-2 

1 2 1 

1 1 

0 5 3 

「2 0 

0 8] 


1-7-5 0 


3 8 

6 0 


0 7 

5 4 



在习题 24~26 中，利用行列式判断每组向量是 


否线性无关. 



" 4 


-7' 


-3' 

24. 

6 


0 


-5 


-7」 


_ 2_ 


6 


' 7 ! 


"-8" 


' 1 

25. 



5 

- 

0 


—~6: 


_7_ 


-5 
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在习题27和习题28中， A ， B 均为矩阵， 
标出每个命题的真假，给出理由. 

27. a . 矩阵的行倍加变换不影响矩阵的行列式. 

b . 矩阵 A 的行列式是 A 的任意一个阶梯形 f / 
中主元之积再乘以 （- iy . 这里 r 是 A 经行 
简化成£/时做的行交换的次数. 

c . 若 A 的列是线性相关的，则 detA = 0. 

d . det(A + S ) = det A + det B . 

28. a . 如果连续作了两次行交换，则新的行列式等 

于原来的行列式. 

b . A 的行列式等于其对角线元素之积. 

c . 若 detA 为零，则其两行或两列相同，或者， 
一行或一列为零. 

d . detA T = (- l ) detA . 

1 0 r 

29. 计算 detfl 5 ,其中 112. 

1 2 1 

30. 利用定理 3( 但不用定理 4) 来证明，若方阵 A 
的两行相等，则 det A = 0. 此结论对两列相等 
的情形也成立，为什么？ 

对习题31~36,在你的解释中指出用到的一个 
合适的定理. 

31. 证明： 如果 A 可逆，则 det / T 1 :-!-. 

det A 

32. 若 A 为一个 nxn 矩阵，试找出一个计算 
det ( M ) 的公式. 

33. 若 A ， S 均为方阵，证明尽管与 SA 可能不相 
等，但 detAB = deta 4 总是成立的. 

34. 若 A , P 均为方阵， P 可逆，证明 deK / MP — 1 ): 
det A . 

35. 假设 f / 为方阵，满足 f / T f / = / ，证明 detf /=± l . 

36. 假设 A 为方阵，且 detA 4 = 0 ,解释为什么 A 不 
能是可逆的. 


在习题37和习题 38 中，验证 detAfl = (det A)(det S). 
(不要使用定理 6.) 



39. 若 均为 3x3 矩阵，且 detA = 4,detfl = -3, 

利用 （ 在课文中或上面习题中的）行列式性质 

计算 


a. det AS b. det5A c. detS T 

d. det A" 1 e. det A 3 

40 . 若 A, 均为 4x4 矩阵， detA = -l ,detS = 2 , 
计算 

a. det AS b. detS 5 c. det2A 

d. detA T A e. det S 1 AS 

41. 验证 detA = detB+detC ， 这里 

C = 

42. A = p °j , S = ^ ^j , 证明 detA = detS + 

detC, 当且仅当 a + d = 0. 

43. 验证 detA = detfl + detC ， 这里 



44. 矩阵 A 右乘一个初等矩阵£对 A 的列的影响 
与左乘一个初等矩阵对行的影响相同.使用 
定理5和定理3以及 £ T 仍为初等矩阵这个明 
显的事实证明<^狀=(<^£)((^4,要求不能 
使用定理 6. 

45. [ M ] 对几个随机选取的 4 x 5 矩阵和 5 x 6 矩阵， 
计算 det / TA 和 detA 4 T . 当 A 的列数大于行数 
时，对 A T A 和 A 4 T 会是如何？ 

46. [ M 】 如果 det A 接近于零，矩阵 A 是接近奇异的 



\a+e b+f\ 
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吗？对 2 . 3 节习题 9 中接近奇异的 4 x 4 矩阵 A 为对比，计算这些矩阵的条件数.当 A 为 4 x 4 

进行实验，计算 A ，10 A , 0. M 的行列式.作 矩阵时，重复这些计算，讨论你的结论. 

练习题答案 

1. 做行倍加变换，在第一列生成零，接着产生一个零行. 

1-3 1-2 1-3 1-2 1-3 1-2 

2 -5 -1 -2 _ 0 1 -3 2 0 1 -3 2 =q 

0-4 5 1 _ 0 -4 5 1 ~ 0 -4 5 1 _ 

-3 10 -6 8 0 1 -3 2 0 0 0 0 

5 -3 2 5 -3 2 

2. det [ v , v 2 v 3 ]=-7 3 -7 = -2 0 -5 第 1 行加到第2行 

9 -5 5 9 -5 5 

= 一(-3)|= _ ^|-(-5 )|j J 按第2列的余因子展开 
= 3.(35) + 5.(-21) = 0 

由定理 4, 矩阵 [ Vl » 3 ]不可逆，由可逆矩阵定理，这三列是线性相关的. 


3.3 克拉默法则、体积和线性变换 


本节应用前面几节的理论得到一些重要且有理论意义的公式以及行列式的几何解释. 
克拉默法则 


克拉默法则在各种理论计算中是必需的，例如，它被用来研究如=6的解受6中数值的变 
化而受到什么样的影响.然而，这个公式对手算是没有多大效果的，除非是 2 x 2 或 3 x 3 矩阵. 
对任意 nxn 矩阵4和任意的 R " 中向量6，令 4( 的表示4中第；列由向量6替换得到的矩阵 
Ai{b) = [a x b •■- aj 

个 

第 |列 

定理7 (克拉默法则） 

设4是一个可逆的 nxn 矩阵，对 IT 中任意 向量^ 方程如=办的惟一解可由下式给出 


_ dot Aj(b) 
一 detA 


=1 ， 2,…， /I 


证用仏，…， fl „ 表示4的列，用 a ， ... ，表示 / IX/I 单位阵/的列.若如，由矩阵乘 
法的定义有 

A-Ii{x) - A[e x ••- x •-•e n ] = lAe l ••- Ax Ae n ] 

=[ 4 …办 '-a„] = Ai(b) 

由行列式的乘法性质 

(det A)(det /• (x)) = det 4 ( 办） 
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左边第二个行列式为; c , (沿第 Z 行作余因子展开），从而 ( detWAsdet 為沙）.由于4可逆，从而 
deM *0, 于是证明了 (1) 式. ■ 


例1利用克拉默法则解以下方程组 

3x, -2x 2 =6 
-5xi +4 x 2 =8 

解 视此方程组为型，利用上面引人的记号， 
「6-2 


A = \ ^ ~ 2 ], Mb ) - 


, A 2 {b) 


' 3 6" 
-5 8 


= 20 


由于 deM = 2, 此方程组有惟 一解. 由克拉默法则，有 
_detA,(fc) 24 + 16 
X， detA 2 

det A 2 (b) 24+30 ^ 

■^ 2 =—^ 4 = —-— = 27 ■ 

det A 2 

在工程上的应用 

许多工程上的问题，特别是在电子工程和控制论，能用拉普拉斯变换进行分析，这种技巧 
将一个适当的线性微分方程组转变为一个线性代数方程组，它的系数含有一个参数•下一个例子 
说明可以出现的代数方程组类型. 

例2考虑下列方程组，其中 s 是一个未定的参数，确定 s 的值，使得这个方程组有惟一解， 
利用克拉默法则写出这个解. 


3% - 2 x 2 = 4 
-6^i +sx 2 =1 

解 视此方程组为如= 6型，则 

由于 deM = 3 s 2 -12 = 3 (s + 2)( s - 2)，当且仅当 s *±2 时，这个方程组有惟一解.对这样的 s 方 
程组的解为 U ，; c 2 ) ，其中 

dct Ai(b) 4 ^ + 2 


[:X f 


Xi = 


det A '3(5+ 2 )( 5 -2) 
det A 2 (b) 3s+ 24 


5 + 8 


det A 3(s + 2)(s-2) ~ (j + 2)(s-2) 


-个求的公式 

克拉默法则可以容易地导出一个求 
•, 满足 


1 矩阵4的逆的一般公式. / T 1 的第 ; ■列是一个向量 


Ax = ej 


此处匕是单位矩阵的第 y 列，^的第；个数值是 / T 1 中 (;， 刀位置的数值，由克拉默法则 
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M _1 中 G _,_/) 元素 } = a 


detA,(Cj) 


回想起 4 表示 A 的子矩阵，它由 A 去掉第行和第 Z 行得到. 4(~)按第 i 列的余因子展开式为 
detA («；) = (- l ) i + ' detA ; ,= C ；1 . (3) 

这里是4的一个余因子.由（2)， A - 1 的 (;， 刀元 素等于余因子 C ; ，.除以 detA . (注 意： C ;, 的 
下标是 ( Z , 刀 的颠倒 .） 于是 

Cn C 2 i C„i 
Ci2 C 2 2 ••- C„ 2 


A - 


det A 


Ci„ C 2 „ ••• C m 

(4) 右边的余因子的矩阵称为 A 的伴随矩阵，记为 adj / l . (伴随这个术语在后面的线性变 
换课程中还有另一层意思 .） 下一个定理简单复述 （4) 式. 

定理8 (逆矩阵公式） 

设 4 是一个可逆的矩阵，则 A -'=— adjA . 

det A 


例 3 求矩阵 A = 

解九个余因子为 

C u =+| 

叫 : 

c 3 , =+| 


.2 1 3. 

1 -1 1 
1 4 -2 


的逆. 


h-2, C 12 =- 


= 14, 


C22 = - 


c 32 = 


3 _ 
-2 __ 


Q3 =- 


c n =- 


= 5 


C 33 ： 


伴随矩阵是余因子的矩阵的转置（例如， C 12 去到(2, 1) 位置），从而 

"-2 14 4] 

adjA = 3 -7 

_ 5 -7 -3 J 

我们可以直接计算 det A ，但下列计算对上面的结果提供了一个检验并计算出 detA 的方法. 


= 14 / 



"-2 14 4" 

■2 

1 3 " 


"14 

0 

O ' 

(adj A )- A = 

3-7 1 


-1 1 

= 

0 

14 

0 


5-7-3 

1 

4 - 2 」 


0 

0 

14_ 


由于 ( adjA ). A = 14/ ，由定理8得 detA = 14 ，且 
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「-2 14 41 [-1/7 1 2/7 

A ' =— 3-7 1 = 3/14 -1/2 1/14 

14 5 -7 -3 5/14 -1/2 -3/14 

数值计算的注解 定理8主要用在理论上的 计算. 的公式使我们不用实际计算出 
就可以推导出 A - 1 的 性质. 如果确实需要求 A - 1 , 除了特殊情形外， 2.2 节中的算法 
给出了一个计算的很好的方法. 

克拉默法则也是一个理论工具，它习惯于用来研究当或中某数值改变时， 
如=6的解如何敏感地变化.（可能由于当取得£» 或 4中的值时存在误差）.当 A 是一 
个具有复数数值的 3 x 3 矩阵时，因为涉及复数的四则计算， [ A 幻的行化简可能很麻 
烦，而行列式的计算相对容易，故克拉默法则有时在手算时被 选用. 对一个很大的 
(实数或复数）矩阵，克拉默法则是无效的，仅计算一个行列式就大约与用行化简解 
有相同的工作量. 

用行列式表示面积或体积 

在下一个应用中，我们证明在本章介绍中阐述的行列式的几何解释.尽管 R " 中的长度和距 
离的一般讨论直到第6章才给出，但我们在这里假设 R 2 和 R 3 中通常的欧几里得长度、面积、 
体积已经是清楚的. 

定理9若 A 是一个 2 x 2 矩阵，则由 A 的列确定的平行四边形的面积 
为 IdetAI ， 若 A 是一个 3 x 3 矩阵，则由 A 的列确定的平行六面体的体积 
为 IdeMI . 

证若 A 为2阶对角矩阵，定理显然成立. 

卜 t = l 矩阵的面积， 

见图 3-4. 若 >4不为对角情形，只需证 = < i 2 ] 能变换成一个对角矩阵， 

同时既不改变相应的平行四边形面积又不改变 IdetAI . 由 3.2 节我们知 
道，当行列式的两列交换或一列的倍数加到另一列上时，行列式的绝对值不 改变. 同时容易看 
到，这样的运算足以能够使 A 变换成对角 矩阵. 由于列交换一点都不改变对应的平行四边形， 
所以只需证明下列在 R 2 和 R 3 中的向量的简单的几何现象就足够了. 

设 fll 和〜为非零向量，则对任意数 c ， 由中和〜确定的平行四边形的面积等于由和 
确定的平行四边形的面积. 

为了证明这个结论，我们可以假设不是的倍数，否则这两个平行四边形将退化成面积 
为0_若 L 是通过0和的直线，则 < 1 2 +1是通过<! 2 且平行于£ < 的直线， ll 2+ ca , 在此直线上，见 
图 3-5 点 A 和 A + Cfll 到直线 L 具有相同的垂直距离，因此图 3-5 中的两个平行四边形具有相同 
的底边，即由0到的线段，所以这两个平行四边形具有相同的面积，这就完成了 的情形的 
证明. 



图 3-4 面积 =|fldi 
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图 3-5 两个等面积的平行四边形 


类似可证明 R 3 的情形.定理对 3 x 3 对角阵显然成立，见图 3-6. 

任意一个 3 x 3 矩阵 4 均可用不改变 IdetAI 的列变换变换成对角矩 
阵 （ 考虑在 A T 上做行变换），所以只需证明这些变换不影响由 A 的 
列确定的平行六面体的体积就行了. 

图 3-7 中用阴影给出一个平行六面体，具有两个倾斜的侧面， 

其体积等于在平面 Span{fl, , a 3 ) 上的底面的面积乘以《 2 到 
Span{a, , fl 3 } 的垂直距离.任意向童+«»,到 Span{fl, ， u 3 } 的距 
离与到 Span{<ii , 的运离相同，这是因为位于平行于 

Span{a t , a 3 } 的平面 a 2 +Span{a 1 , flj} 上，所以当 bi a 2 a 3 ] 变到 
[a, 0 ,+ai, fl 3 ] 时，平行六面体的体积不变，于是列的倍加变换不 图 3-6 体积 =la fc H 

影响平行六面体的体积.由于列的交换也不影响体积，所以定理证毕. 



图 3-7 两个等体积的平行六面体 



例4计算由点 (-2 ,2) ，(0，3) ,(4，- 1) 和 (6,4) 确定的平行四边形的面积.见图 3-8 a . 



图 3-8 平移一个平行四边形不改变其面积 






182 


第 3 章 


解 先将此平行四边形平移到使原点作为其一顶点的情形.例如，将每个顶点坐标减去顶 
点(2，-2)，这样，新的平行四边形面积与原平行四边形面积相同，其顶点为 
(0,0), (2,5), (6,1) 和 (8,6) 

见图 3-8 b . 此平行四边形由 A = g 1 的列所确定，由于 Idet AN -28 I , 所以所求的平行四边形 
的面积为 28. ■ 

线性变换 

行列式可用于描述平面和 K 3 中线性变换的一个重要的几何性质.若 T 是一个线性变换 ， S 
是 r 的定义域内的一个集合，用 r ( s ) 表示 s 中点的 像集. 我们对 r ( s ) 的面积（体积）与原来的 
集合 S 的面积（体积）相对比有何变化这件事感兴趣.为了方便，当 S 是一个边界为平行四边 
形的区域时，我们就用 S 表示一个平行四边形. 

定理 10设是由一个 2 X 2 矩阵确定的线性变换，若 S 是 K 2 中一个平行四边 
形，则 

{ r ( s ) 的面积 } = |det A |.{ S 的面积} ( 5 ) 

若: T 是一个由 3 x 3 矩阵确定的线性变换，而_ 5 ■是/? 3 中的一个平行六面体，则 

{ r ( S ) 的体积} =| det 斗 { S 的体积 } ( 6 ) 

证 考虑 2 x 2 的情形， /4 = [ c , c 2 ], 

•个顶点在 K 2 中原点的平行四边形，若它由向量和确定，则有以下 等式； 
s = {Sxb^+s 2 b 2 : 0 彡&彡 1 ， 0 < 5 2 ^ 1 } 

S 在: T 下的像由以下形式的点组成： 

了 (认 +s 2 b 2 ) = SiT(b } )-\- s 2 T(b 2 ) = s^Ab x +s 2 Ab 2 

这里，从而 r ( s ) 是一个由矩阵 ua , /4 A 2 ] 的列确定的平行四边形.这个矩阵 
可写成 Afl ， 这里6 2] .由定理9和行列式的乘积定理. 

{HD 的面积 } = |det = |det /4|| detB | 

= | det /4 |.{S 的面积 } ( 7 ) 

对任一个具有形式 P + S 的平行四边形，这里 ^ 是一个和上面一样有一个顶点在原点的平行四边 
形.已知 r 将 P + S 变到 r ( p ) + r ( S ) (见习题 26.) 由于平移不改变一个集合的面积，所以 
{T(P+ 幻的面积} = IT(P) + r(s) 的面积 } 

= {7 XS ) 的面积 } 平移 
= | det /4|.{ S 的面积 } 由⑺ 

= | det /4 |.{p + S 的面积 } 平移 

从而 (5) 式对 K 2 中任意的平行四边形均成立 （6) 式在 3 x 3 情形的证明是类似的. ■ 

当我们尝试把定理10推广到 K 2 和 K 3 中不是由直线或平面所围的区域时，必须面对如何定 
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义和计算这个区域的面积或体积的 问题. 这是一个在微积分中研究的问题，我们仅仅对 R 2 情形 
给出基本思想.若/?是一个有限面积的平面区域，则 可由其 内部的小正方形方格来近似，通 
过使这些正方形充分小，/?的面积可由这些小正方形的面积之和充分地逼近 • 见图 3-9. 
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图 3-9 由正方形近似-个平面区域.近似的程度随格子变细小而改进 



若 r 是一个由 2x2 矩阵确定的线性变换，则/?在 r 下的像由中小正方形的像来近似•定 
理10的证明说明每一个这样的像是一个平行四边形，它的面积是 Idet A 乘以这个正方形的 面积. 
若 〆 是中这呰正方形的并集，则 7(/0 的面积是 IdetA I 乘以 〆 的面积.见图 3-10. 7(/0 的面 
积也逼近 r (/?) 的面积.当这个过程无限进行下去时，就可以得到下面推广的定理10的证明. 
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从而得《在此单位圆内，即满足《, 2 +« 2 2 < 1 ,当且仅当 jc 在五内，即满足 ( jc , / a ) 2 +( x 2 / b ) 2 < 1 .由 
定理10的推广， 

{ 椭圆的面积 } = {7 XD ) 的面积 } 

= |det 斗 {D 的面积 } 

= abn ( l ) 2 =itab _ 

练习题 


设 S 为由向量私= 




确定的平行四边形，令4= 


面积. 



计算 S 在映射下的像的 


习题 3.3 



利用克拉默法则求习题1~6中方程组的解. 

1. 5x x +1 x 2 =3 
2xi + 4 ^ 2=1 
3. 3x\ — 2 x 2 = 7 

-5x { + 6x 2 = -5 
5. 2x x + x 2 = 1 
~3a：i + x 3 = -8 
A + 2^3 = —3 
在习题 7~10 中，确定参数 s 的值，使方程组 
有惟一解，并求出该解. 

7. 6 灯 | •¥ Ax 2 = 5 8. 3 风 - 5^ 2 = 3 

9x i +2sx 2 =-2 9 Xl +5sx 2 =2 

9. 风 -2 从 2 =-1 10. 2 叫 + x 2 =l 

+ 6^ 2 = 4 3 坏 + 6^ 2 = 2 

在习题 11~16 中，求给出矩阵的伴随矩阵，然 
后利用定理8给出矩阵的逆矩阵. 

0-2 - 


11 . 


13. 


15. 


12 . 


3 0 0 


0 2 1 
!2 3 4 
2 4 
|0 -3 1 
0 3 

17. 证明： 若 4 是 2x2 矩阵，则对 4- 1 , 


16. 


2 -2 1 

0 1 0 


定理8与 


2.2 节中定理4给出相同的公式. 

18. 假设4中所有元素均为整数，且 det4 = l .解 
释为什么4- 1 中所有元素也是整数. 

在习题19~22中，分别求给定顶点的平行四边 
形的面积. 

19. (0, 0), (5, 2), (6, 4), (11， 6) 

20. (0,0), (-1 , 3) ,(4 , -5) , (3 , -2) 

21. (-1，0)，（0, 5)，(1，4)，（2, 1) 

22. (0 ， -2) ， （6 ， -1) ， （-3 ， 1) ， （3 ， 2) 

23. 求一个顶点在原点，相邻顶点在 (1 ,0,-2), 
(1,2,4), (7 , 1 , 0) 的平行六面体的体积. 

24. 求一个顶点在原点，相邻顶点在 (1, 4, 0) ， 
(-2 ,-5,2), (-1,2, -1) 的平行六面体的体 
积. 


25. 利用体积的概念解释为什么 3 x 3 矩阵4的行 
列式为零，当且仅当4不可逆.要求不利用 3.2 
节中的定理 4. (提 示： 考虑4的列 .） 


26. 令 r : R"—R" 为线性变换， p 为 it 中一个向 
量， S 为 IT 中集合，证明 ： p + s 在 r 下的 
像等于 R " 中平移的集合 T(p) + T(S). 

27. 令 S 是由向量 * |= |^^| 和 * 2 = 广^|确定的平 


-3 
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下像的面积. 

28扇 0 2 =|^|,A = P & 重复27题. 

29. 求 R 2 中顶点为 0,v, ,v 2 W5 角形的面积公式. 

30. 令/?是顶点为 (X| ,艿），(為 ，y 2 > ,(x 3 ,> 3 ) 的三角 


形. 证明：{ 三 角形的面积}=全 


x t 

det x 2 
_x 3 


y. i" 
>2 i 

>3 1 . 


(提 示： 通过减去一个顶点向量，将平移到 
原点，再利用习题 29.) 

a 0 0 

31. 令 r:R 3 -»ne 是由矩阵4= 0 fc 0确定的 
0 0 c 

线性变换，这里(:为正数， 令 S 为单位球 
体，其边界曲面方程为 W+xJ + xIsl. 

a .证明 T(S) 的边界为椭球面，方程为 


i 44 - 


b. 利用单位球体体积为 fn 的事实确定边界 


为 (a) 中椭球面的区域的体积. 

32.令 S 是 R 3 中具有顶点 0, ,« 2 的四面体， 

S' 为具有顶点为 0 . v, , *> 2 , v, 的四面体，见 


b. 利用 {sW 体积底面积■[髙 } 这个事实 


给出一个四面体 s' 的体积公式 ■ 



33. [M] 任取一4 x 4矩阵，检验定理8中的逆矩阵 
公式.利用你的矩阵程序计算所有的3 x 3子矩阵 
的余因子，构造伴随矩阵，令 B = (adj A)/(detA). 
计算 B-inv(A) ,这里 inv(A) 是由矩阵程序计 
算出的 A 的逆.使用浮点运算保留最大可能的 
小数位.报告你的结论 • 

34. [M] 任取一个 4x4 矩阵和一个 4x 1向量 fc， 
检验克拉默法则.求 A* = fc 的解并与 /rl 中 
元素相比较.利用克拉默法则，对你的计算机 
程序，写出输出 x 中第二个元素的指令. 

35. [M] 在 MATLAB 中，对一个任意取的30 x 30 
的矩阵 A， 使用 flops 命令统计出计算 /T 1 所需 
要的浮点运算的次数.将这个数与计算 


下面的图形. （adjA)/(detA) 所需的浮点运算次数相比较. 

a. 描述一个将 S 映射到 S' 上的线性变换. 


练习 题答案 


S 的面积为 | det. 


[3 3 | = 


14, detA = 2. 由定理10, S 在映射 x — Ax 下的像的面积为 


|detA|.{sW 面积 }= 2.14 = 28- 


第3章补充习题 

1. 指出每个命题的真假，给出理由.这里所有矩阵 
均设为方阵. 

a . 若 A 是2 x 2矩阵且其行列式为0,则 A 的一 
列是另一列的倍数. 

b. 若 3x3 矩阵 A 的两行相等，则 detA = 0. 


c. 若 A 是 3x3 矩阵，贝 !] det5A = 5detA . 
d •若 A, fl 均为 nxn 矩阵，满足 detA = 2 , 
detfl = 3, Hddet(A + B) = 5. 

e. 若 A 为 《xn 矩阵且 det>\ = 2 ，则 detA 3 =6. 

f. 若由 A 中交换两行生成，则 detfl = detA, 




9. 利用行变换证明 AttT = {b-a){c-a){c-b). 

10 . 令 /( f ) = detV ， at ,， x 2 , x 3 两两不等，解释/⑴ 
为什么是一个三次多项式，证明 f 3 的系数非 
零，并在/的图上找三个点. 

11 . 求由点 （1, 4)， (-1, 5)，(3, 9) 和(5, 8) 确定的平行四 
边形的面积.你如何能判断由这些点确定的 
四边形刚好是一个平行四边形？ 

12 . 利用平行四边形面积的概念描述对一个 2 x2 
矩阵 A 当且仅当 A 可逆时成立的命题. 

13. 若 A 可逆，证明 adjA 也可逆，且 （ adj / ir 1 

det 4 

(提 示： 给定矩阵和 C , 什么计算能说明 
C 是的逆矩阵？） 

14. 令 A ， fl , C , Z > 和/均为 nxn 矩阵，利用行列式 
的定义或性质证明下列公式，公式 ( c ) 在特征值 
(第5章）的应用中是有用的. 


c ' de {c oj = (deU)(detZ>) = det [o d] 

15. 令 4， B ， C ， Z ) 均为 《 x « 矩阵， / i 可逆. 

a . 求矩阵 Z 和 y , 使得生成分块 Lf / 的因式分 


Kdet / D - de ^ ZJ - C / T ' S ) 


b . 证明： 若 /1 C = C 4 ， 则 


16. 设■/是元素全为 1 的 nx „ 矩阵，考虑 
A = (a-b)l+bJ , BP 
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g . 若为由 A 中第3行乘以5生成，则 
det = 5 det 4 . 

h . 若为通过 A 中任意 n _ l 行的线性组合加到 
另一行生成，则 detfi = detA . 

i . det A r = -det A . 

j . det (-/ l ) = - det / l . 

k . 

l. 任 意一个 n 个未知数 n 个方程的方程组均可 
由克拉默法则解出. 

m . 若 《, v 属于 R 2 , 且 det[u v ] = 10 ,则平面中 
顶点为0，》,»>的三角形面积为 10. 

n . 若 A 3 = 0 ,则 det /! = 0 . 

o . 若 A 是可逆的，则 d e tf = det / l . 

P . 若 A 是可逆的，则 ( deMXdet / rjzl . 

使用行变换证明习题 2~4 中行列式都等于 0. 
12 13 14 1 a b + c 

2. 15 16 17 3. 1 b a + c 

18 19 20 1 c a + b 

a b c 
4. a + x b + x c + x 
a + y b+ y c + y 

计算习题 5~6 中的行列式. 

4 8 8 8 5 

0 10 0 0 

6. 6 8 8 8 7 

0 8 8 3 0 

0 8 2 0 0 

7. 证明 R 2 中经过两不同点 （； d ， yi )，(； c 2 ， y2 ) 的直 
线的方程可以写成 

det 1 x , j, =0 
} ^2 y 2 _ 

8. 求一个类似于习题7的 3 x 3 行列式方程，描述 
通过点 U ，: M 且斜率为 m 的直线. 

习题 9-10 涉及下列范 德蒙德 ( Vandermonde ) 
矩阵的行列式. 


9 19 9 9 
9 0 9 9 2 

5 . 4 0 0 5 0 

9 0 3 9 0 

6 0 0 7 0 
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a b b ••• b 

b a b … b 

A~ b b a •• b 


\_b b b a\ 

通过下面的计算推出 detA = ( a - br'[a + 
(n-1)*]： 

a. 从第 2 行减去第 1 行，从第3行减去第2 
行，如此类推，说明为什么这样的操作不会 
改变矩阵的行列式. 

b. 对 （a) 中所得的矩阵，将第2列加上第1 
列，将第3列加上第2列，如此类推，说明 
为什么这样的操作不会改变矩阵的行列式. 

c. 求由 （b) 所得到的矩阵的行列式. 

17. 设为16题中的矩阵，并设 

a~b b b … b 

0 a b … b 

0 b a … b ， 

0 b b … a 

b b b … b 

b a b … b 

C= b b a ... b 

b b b … a 

这里 A,fl,C 基本相同，除了 的第一列等于 
和 C 的第一列之和•在 3.2 节讨论的行列式函 
数的线性性质给出 det/l = detfl+detC . 利用 


这个事实用归纳法证明16题给出的公式. 

18. [M] 运用16题的结论求下面矩阵的行列式，使 
用矩阵程序验证你的结果. 



19. [M] 使用矩阵程序求下面矩阵的行列式 



使用上面计算结果猜测下面矩阵的行列式，用 
行变换计算其行列式来验证你的猜测. 



20. [M] 使用19题的方法猜测下面矩阵的行列式， 
验证你的猜测 .（ 提示： 利用习题 14(c) 和习题 
19的结论 .） 
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介绍性实例空间飞行与控制系统 


1981 年 4 月，在清凉的棕榈星期日 （ 复活节前的星期日） 

的早晨. 12 层楼髙. 75 吨重的美国哥伦比亚号航天飞机壮观 
地飞离发射台.作为十年集中研究和开发的成果，这架美国第 
一架航天飞机是控制系统工程设计的最好的例子，涉及工程 
学的许多分支一航空、化学、电子、液压以及机械工程. 

航天飞机的控制系统对飞行是绝对关键的.由于航天 
飞机是一个不稳定的空中机体.在大气层飞行时它需要不间 
断地用计算机监控.飞行控制系统不断地向空气动力控制 
表面和 44 个小推进器喷口发送命令.图 4>1 展示了一个典 
型的闭环反馈系统.它用来控制航天飞机在飞行时的俯仰角 
( 即头部圆锥体的仰 角）- 符号 ® 表示这里来自各种各样的 
传感器的信号被添加到沿此图顶部传递的计算机信号中. 

从数学的角度看 ，一 个工程学系统输人和输出信号都是 
函数，如图 4-1 所示，这些函数的加法和标量乘法在应用中 
是重要的.在 4.1 节和 4.8 节中，我们将会看到，函数的这两 
个运算具有完全类似于 R " 中向量的加法和标量乘法的代数 
性质.由于这个原因，所有可能的输人（函数）的集合称为一个向量空间.系统工程学的数学基础依赖于 
函数的向量空间，因此我们需要把 R ” 中向量的理论推广到包括这些函数.后面，我们将看到其他向量空 
间如何出现在工程学、物理学和统计学中. 

预定俯 预定俯 




S.Nise, Benjamin-Cummings Publishing, 1992, p.274. Simplified drawing based < 
Space Shuttle GN&C Operations Manual, Rockwell International, 1988.) 
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在第1章和第2章中种植的数学种子在这一章中生长并且开始开花.当我们把 R " 仅仅看作 
自然地出现在应用问题中的各种向量空间之一时，线性代数的美和力量将更清楚地显露出来. 
我们将看到从 K ” 本身研究向量空间并不是很困难的，因为我们可以利用 K 2 和 R 3 中的几何经验 
使许多几何概念直观化. 

在 4.1 节中给出一些基本定义之后 ，一 般向量空间的框架逐步展开并贯穿于全章 . 4.3 节~4.5 
节的一个目标是表明其他的向量空间是如何类似于 K " 的 .4.6 节讨论的秩是本章的高潮之一，利 
用向量空间的术语将矩阵的重要知识连在一起 . 4.8 节将本章的理论应用到离散信号和差分方 
程，它们在比在航天飞机中用到的数字控制系统中有用 .4.9 节中的马尔可夫 （ Markov ) 链与本 
章中理论性较强的部分相比有了质的变化，它为第5章中出现的概念提供了较好的例子. 


4.1 向量空间与子空间 


第1章和第2章中许多内容停留在 IT 的一些简单且明显的性质上，这些性质列在第 1.3 节 
中.同样地，我们将看到许多其他的数学系统具有与 K ” 中相同的性质，这些具体而有趣的性质 
列在下面定义中. 

定义 一个向量空间是由一些被称为向量的对象构成的非空集合 V ，在这个集合上定义两 
个运算，称为加法和标量乘法 （ 标量取实数），服从以下公理 （ 或法则 ） 9 ，这些公理必须对 V 
中所有向量 M ， V ， W 及所有标量 C 和 J 均成立. 

1. M ， V 之和表示为 M + V ， 仍在 V 中. 

2. M + V =V + M . 

3. (m + v ) + W =M + (v + w ). 

4. V 中存在一个零向量 0 ， 使得 M + 0 = M . 

5 . 对 V 中每个向量 M ， 存在 V 中向量 - M , 使得 M + (-1/) = 0. 

6. M 与标量 C 的标量乘法记为 CM ，仍在 V 中. 

7. c(m + v ) = cm + cv . 

8. (c + d)u = cu + du . 

9. c(du) = (cd)u. 

10. \u = u, 

只需利用这些公理，我们可以证明公理4中的零向量是惟一的.对 V 中每个向量《，公理5 
中向量 - U 称为 U 的负向置，也是惟一的，见习题25和26,下列简单事实的证明也在习题中给 
出了大致 轮廓： 


© 更专业地讲，V是一个实数向量空间，本章所有理论对复向量空间（数取复数）也成立、在第5章中我们会看到 
一些例子.到现在为止，所有数假设为实数. 
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对 V 中每个向量 M 和任意标量 C , 有 


0« =0 

( l ) 

c0 = 0 

(2) 

-u = (-I)m 

(3) 


例1空间 K " ( ) 为向量空间的首要的例子. R 3 的几何直觉可以帮助我们使本章的许 

多概念清晰化并且直观化. ■ 

例2设 V 是三维空间中所有有向线段的集合，如果其中两个向量方向相同且长度相等， 
则二者视为相等，由平行四边形法则定义加法（见 1.3 节），且对 V 中每个向量 V ， 定义 cv 为长 
度等于 | c | 乘以 v 的长度.若 c >0, 则 cv 与 v 同向，否则与 v 反向（见图4-2)，证明 V 是一个向 
量空间.这个空间是物理学中变力问题中一个常用的模型. 

解 V 的定义是按几何方式的定义的，只用到长度和方向的概念，没有涉及;坐标系， 
一个零长度的有向线段就是一个单点，表示零向量. v 的负向量为 (- l ) v , 所以公理1, 4, 5, 6, 
10显然成立，剩下的可用几何方法证明，比如图4-3、图 4-4. 


* / 

"y 7 

/ 

图 4-2 

例3设 S 是数的双向无穷序列空间 （ 通常写成行而不写成 列）： 

{ 3^ } =(…， ； V -2 ， ； V - I ，凡，兄，乃，…） 

若 { zj 是 S 中的另一个元素，则和 { h } + { z *} 是序列 {%+ z ,} ，它由{%}与 {&} 对应项之和 
构成，数乘 cb t } 是序列 { c ^}， 用与 R " 中相同的方法可以证明向量空间的那些公理. 

S 中的元素来源于工程学，例如，每当一个信号在离散时间上被测量（或被简化）时，它 
就可被看作 S 中的一个个元素，这样的信号可以是电的、机械的、光的等等.在本章“介绍性 
实例”中提到的航天飞机的大控制系统，就使用离散或“数字”信号.为了方便，我们将称 S 为 
( 离散时间）信号空间，一个信号可以直观地由图 4-5 表示. 

lllllll , . ,T 

图 4-5 —个离散时间信号 ■ 

例4对 n >0, 次数最高为 n 的多项式集合1-„由形如下列的多项式组成： 
p ( t ) = a 0 + a l t + a 2 t 2 + ■■■ + aj " 



( 4 ) 
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这里系数 a 。, …，〜和变量 f 均为实数， p 的次数是 （4) 中系数不为零的项中 r 的最高幂，若 
p ⑴ = ae *0 ，则 p 的次数为零，若所有系数均为零，则 P 称为零多项式，零多项式包含在 R 中， 
尽管它的次数没有定义. 

若 p 由 （4) 式给出， q ( t ) =bo + bit +---+ b „ t " ,则 p+fl 定义为： 
ip + qYt ) = p ( t )+ q ( t ) 

= ( o 0 +^ o)+(fli + bi)t + ---+( a „ + b n ) t K 

标量乘法印定 义为： 

( cp )( t ) = cp ( t ) = aio +( az , )【+••• + ( ca n ) t n 

这些定义满足公理 1 和公理 6, 这是因为 p + fl 和印均 为次数不超过 n 的多项式，公理2, 3 
和公理 7-10 由实数性质验证.显然，零多项式可以作为公理4中的零向量，最后， （- l ) p 作为 P 
的负向 fi ， 所以满足公理5,于是 P « 是一个向量空间. 

对不同的 n , 向量空间 P „ 用于，比如说，统计数据的趋势分析中，在 6.8 节中 讨论. ■ 

例5设 V 是定义在集合1>上的全体实函数的集合（典型地， ® 为实数集或实轴上的区间） • 
用通常方式定义加法即 / + g 仍为函数，在 B 中 f 点的值为 /( f )+ g (0. 同样地，对标量 c 和 V 中的 
/，标量乘法仍为函数，在 r 的值为# W . 例如，若 = /(0 = l + sin 2 r , g (0 = 2+0.5 h 则 

(/+gm = 3 + sin 2 r + 0.5 f , (2 gXt ) = 4 +t 

V 中两个函数相等，当且仅当对任意 ID 中的 f 函数值相等.从而 V 中的零向童是恒等于零的 
函数/(0=0,任意/的负向量为 (-1)/. 公理1和公理6显然成立，其余公理由实数性 
质得证，所以 V 为一个向量空间. _ 

把例5中的向量空间 V 中每个函数看作一个独立的个体是重要的，如同在向量空间中的一 
个“点”或向量那样，两个向董/与《的和（/与 g 为 V 中的函数.亦即向量空间中的元素〉 
可以通过图 4-6 给予直观解释，因为这样可以帮助你将 R " 中建立的几何直觉上升到一般向量空 
间，“学习指南”可以帮你接受更一般的观点. 



图 4-6 两个向量（函数）之和 


子空间 

在许多问题中，一个向量空间是由一个大的向量空间中适当的向量的子集所构成.在此情 
形下，向量空间的十个公理中只需要验证三个，其余的自然成立. 

定义向量空间 V 的一个子空间是 V 的一个满足 以下三 个性质的子集《: 
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a . V 中的零向量在《中戶 

b . f / 对向量加法封闭，即对//中任意向量 B , V ， 和 B + V 仍在《中. 

C . «对标量乘法封闭，即对//中任意向量 B 和任意标量 C ， 向量 CII 仍在《中. 

性质 ( a )、（ b )、（ c ) 保证 V 的子空间本身对 V 中的向量空间运算而言是一个向量空间.为 
证此结论，注意到⑻、 （ b )、 ⑻分别是公理1、4、 6. 公理2和3及公理7~10自然成立，由于它 
们对 V 中所有元素均成立，自然包括//中的元素，公理5在//中也成立，因为若《在《中， 
则由 ( c ) 知，（-1)«也在《中，同时，从本节等式3知，（- 1) b 即公理5中的 - u . 

这样每个子空间都是一个向量空间反之，每个向量空间是一个子空间 （ 针对本身或其他 
更大的空间而言）.两个向量空间，若其中一个在另一个内部，此时 子空间 这个词被使用，而 V 
的子空间是将 V 看作更大的空间（见图 4-7). 



图4>7 V 的一个子空间 


例6向量空间 V 中仅由零向童组成的集合是 V 的一个子空间，称为零子空间，写成⑼. ■ 
例7令 P 为全体实系数多项式的集合， P 中运算的定义与函数运算相同，则 P 是定义在 R 
上的全体实函数的一个子 空间. 再者，对每个 / t >0, P n 是 P 的子空间，因为 P , 是 P 的子集，它 
包含零多项式，且 P „ 中两个多项式之和仍在 P „ 中，数乘以 P „ 中一个多项式仍在 P a 中. ■ 

例8向童空间 R 2 不是 R 3 的子空间，因为 R 2 甚至不是 R 3 的子集 （ R 3 中的向量有3个分 
最，而 R 2 中的向量仅有两个分 量〉， 集合 

#=||^广是实数 

是 R 3 的一个子集，尽管从逻辑上讲它与 R 2 不同，但看起来很像 R 2 , 见图4-8,证明《是 R 3 的 
—个子空间. 


图 4-8 作为 R 3 的子空间的平面 


© 有些教材将定义中的 (a) 替换成//非空，则 (a) 可由 （c) 推出 • 且有 0ii=0. 但检验子空间最好的方法是首先观察零 
向置. 若零向置在 H 中，则 (b)、（c) 必须验证，若零向量不在《中，则 H 不是子空间，且其余性质不必 检验. 
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解 零向量在《中，且对向量的加法和标量乘法，《是封闭的，这是因为对《中的向量 
而言，那些运算产生的向量中第3个分量仍为零（从而属于《 ), 所以《是 R 3 的一个子空间 . _ 
例9 R 3 中一个不通过原点的平面不是 R 3 中子 空间. 因为此平面不包含 R 3 中的零向量.类 
似地， R 2 中一条不通过原点的直线，如图 4-9 所示，也不是 R 2 的子空间 • 


' 

X - 1 

图 4-9 不是向量空间的直线 _ 


由一个集合生成的子空间 

下一个例子说明了—个描述子空间的最常用的方法.与第丨章中相同，线性组合这个词表示 
一些向董的任意标量乘法之和， Span{v 1 , -,v J ,} 表示所有可以表示成〜•••，〜的线性组合的向量集合 • 
例10给定向童空间V中向量 v,，v 2 , 令 if = Spank,v 2 }, 证明《是V的一个子空间. 

解 由于 0 = 0v,+0v 2 , 所以零向量在//中，为证对加法封闭，任取 H 中两个向量，即 

« = S | V |+ S 2 V 2 , w = t , v , + t 2 V 2 

对向量空间 V, 由公理2、3和8知 

u + w = ( S | V | + S 2 V 2 ) + (r,v, + t 2 v 2 ) 

= ( S ,+ t ,) V ,+( S 2 + t 2 ) V 2 

所以 《 + w 在 // 中，进一步，若 c 是任意标量，由公理7和9知 
cu = c(s,v, + S 2 v 2 ) = (cs,)v, + (cs 2 )v 2 

这证明 c« 在//中，从而//对标量乘法封闭，从而#是"的一个子空间. _ 

在 4.5 节中我们将证明 R 3 的每一个非零子空间，除了 R 3 本身之外，要么是 Span{ Vl ，v 2 }, 
这里〜 v 2 是某线性无关的两个向董，要么是 Spaii{v}, v + 0 .对第一种情形，此子空间是一个 
通过原点的平面，第二种情形，子空间是一条通过原点的直线（见图 4-10). 记住这些几何图 
形是有好处的，甚至对一个抽象的向量空间也有帮助. 



图 4-10 —个子空间的例子 
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例10的讨论可以很容易地推广从而证明下面的定理. 


定理1若 V, ， …, v p 在向量空间 V 中，则 Span { v ,，."， v p } 是 V 的一个子空间. 

我们称 Span { v ,，..., v p } 是由 { v ,,...， v p } 生成（或张成）的子空间， 任给 V 的子空间//，//的 
生成 （ 或 张成） 集 是集合{ V ,， …， v p } C 孖 ， 使得 W = Span { v ,，".， v p } • 

下例说明如何使用定理 1. 

例 11令 W 是所有形如 ( a -3 M - w ， fc ) 的向量的集合，这里 M 是任意数，即 
H = {(a -3 b , b - a , a , b ) : a,b € 1 R } 


证明//是 K 4 的一个子空间. 

解将 H 中向量写成列向量，则 H 中任意向量具有如下 形式： 


~ a ~3 b 


l 


-3' 

b-a 

a 

- a 

-1 

1 

+ 办 

1 

0 

b 


. 0 . 


1 


V | v 2 

这个计算表明 W = Span { v ,， iM ，这里 v ,, v 2 # 示如上，从而由定理1知//是 R 4 的一个子空间 . _ 
例11表明一个有用的技巧，用来表示作为某些向量线性组合的集合的子空间 //. 若 
//= Span { v ,，一， v p }, 我们可以把这个生成集中的向量 v ,, …, v p 看作“柄”，它们使我们能够掌握 
这个子空间 WW 中无穷多个向量的运算经常被简化成生成集中的有限多个向量的运算. 

例12问 A 取何值时， y 在由 v ,, v 2 ， v 3 生成的 R 3 的子空间中？其中 



r 


' 5" 


-3" 


'-4' 

Vj = 

-i 

， V 2 = 

-4 

， v 3 = 

1 


3 


-2_ 


-7 


o 」 


h 


解 此问题是 1.3 节中的练习题2,这里用子空间这个词还不如用 Span { v ,， v 2 , v 3 }. 此处; y 在 
Spanh ^^} 中当且仅当/« = 5.这个解法现在值得复习一下，可以复习 1.3 节中习题11~14和 
习题 17-21. _ 

虽然本章中许多向量空间是的子空间，但牢记那些抽象理论用在其他向量空间仍成立是 
很重要的，函数的向量空间起源于许多应用，这些空间在后面的章节将受到关注. 

练习题 


1. 通过证明标量乘法不封闭，证明 R 2 中所有形如 (3 i ，2 + 5 i ) 的点集//不能构成一个向量空间 .（ 中一 
个特殊向量《和数 c ， 使《<不在 H 中.） 

2. 令 W = Span { v ,，."，》 v } ，这里 vw , 在向量空中 V 中，证明 v * 在 W 中， l < k< p . (提 示： 先写一个 
能证明》^在7中的方程，再类似证明一般情形 .） 
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习题 4.1 

令 V 是 V 平面中的第一象限，即 




a . 若 k , v 在 V 中 ， k + v 在 V 中吗？为什么？ 

b . 找 V 中一个特殊向量 k 和一个特殊数 c ，使 
得《/不在 V 中.（这足以说明 V 不是一个 
向量空间 .） 

2. 令 W 是 V 平面中第一象限与第三象限的并集， 

即叫 [;}—}. 

a . 若 m 在 VV 中， c 为任意数， ck 在 VV 中吗？ 
为什么？ 

b . 找 VV 中特殊向量 《, v , 使得 《+ v 不在 VV 中. 
这足以说明 VV 不是一个向量空间. 

3. 令 W 是 V 平面上所有单位圆内和圆上的点集， 

即，找出一个特殊的例 

子，两个向量或者是一个向量与一个数，证明 
W 不是 R 2 中的一个子空间. 

4. 构造一个几何图形说明为什么 R 2 中一条不过 
原点的直线对向量的加法不封闭. 

在习题5~8中， n 取适当的值，判定给出的集 
合是否为 P , 的子空间，验证你的答案. 

5 - 所有形如/>(0 =如 2 的多项式，此处 aeR . 

6. 所有形如 〆 /) = a +/ 2 的多项式，此处 aeR . 

7. 所有次数最多是3的整系数多项式. 

8. 所有 P „ 中使得 p (0) = 0 的多项式. 


9. 令 W 为所有形如 


的向量集，找 R 3 中一个 


向量 V ，使得 W = S P an { V }， 为什么这样能证明 
W 是 R 3 的一个子空间？ 

_2 r ] 

10.令 W 为所有形如 | o | 的向量集，证明//是 R 3 


的一个子空间.（利用习题9的方法 .） 
\5b + lc' 
b 


11. 令 W 是所有形如 


的向量集，这里 


是任意的实数，找向量 《， v 使得 W = Span {«, v }, 
为什么这样能证明 W 是 R 3 的一个子空间？ 

「5 + 3 ， 


12. 令 VV 是所有形如 


的向量集，证明 VV 是 


R 4 的一个子空间.（利用习题11的方法 

13. 令 v , = 


f 


'2 


4' 


'3' 

0 

， V 2 = 

1 

， V 3 = 

2 

, w = 

1 

L-ij 




6」 


2 - 


a . 故在 { VbVjd 吗？ { vuwj 中有多少个向 
量？ 

b . Spanlv ^ v ^ vJ 中有多少个向量？ 

c . w 在由生成的子空间中吗？为什 
么？ 

8 ' 

14. 令 v ,， v 2 ， v 3 与13题相同， m >= 4 , w 在由 
7 

{ v ,， v 2 , v 3 } 生成的子空间中吗？为什么？ 

在习题15~18中，令 W 表示已给形式的所有 
向量集合，这里0>,£：表示任意实数，在每种情形 
下，要么给出生成 VV 的向量集合^，要么给出一 
个例子证明 VV 不是一个向量空间. 

2 +r 


15. 


17. 


16. 


18. 


2b + a 
*4 a + 3 fe 


I a + b + c 
c ~2 a 

19. 一个物体 m 挂在弹簧的末端，若向下拉动物 _ 体 
再放开，这个物体-弹簧系统开始振动，物体 
从其静止位置的位移; V 由下列形式的函数给出 



向董空间 


197 


y(t)-c x coswt + c 2 sin ⑽ ( 5 ) 

这里 to 是一个常数，它与弹簧及物体有关 .（ 见下 
图 •） 证明由 （5) 式给出（其中 ta 固定， c ,, c 2 任意） 
的所有函数的集合是一个向釐空间. 

It 

| 

20- 定义在 K 中闭区间上的全体实连续函数 
的集合记为 C [ a , b ] , 此集合是定义在 [ a , fc ] 上 
的全体实函数的一个子空间. 

a . 关于连续函数.需要证明什么结论才能说明 
C [ a ， fc ] 如命题所说的确实是一个子 空间？ 

( 这些结论在微积分中经常讨 论）. 

b . 证明 {/ e cta,fc ]： /⑷= /( fc )} 是 的 

—个子空间. 

对固定的正整数 m ,/ i . 在通常的矩阵加法运算 
和实数乘法运算之下，所有 mxn 矩阵的集合 
是一个向釐空间. 

21•判定所有形如 g 的全体矩阵的集合是 

否是财扣的一个子空间. 

22. 令 F 是一个固定的 3 x 2 矩阵 ，令孖 是财城中 

所有使得 M = 0( 中的零矩阵）的矩阵4 

的全体构成的集合，判断 H 是否是财如的一 
个子空间. 

在习题23和习题24中，判断每个命题的真假， 
给出理由. 

23. a . 若/是一个向釐空间 V 中所有定义在 K 

上的一个实函数，且 /( r ) = 0, 则/是 V 中 
的零向童. 

b . 在三维空间中，一个向量是一个箭头. 

c . 对向童空间 V 的一个子集若零向量在 



W 中，则//是V的一个子空间. 

d. —个子空间仍是一个向童空间. 
e_ 模拟信号被用在航天飞机的主控系统，在本 
章“介绍性实例”中有提到. 

24. a. —个向釐是一个向童空间中任意一个元素. 
b. 若《是向量空间V中一个向量.则(-1)„与 
«的负向量相同. 

C. —个向童空间仍是一个子空间. 

d. R 2 是 K 3 的一个子空间. 

e. —个向量空间V的一个子集//,如果满足 
以下条件： （i) V的零向量在//中， （u) 
«,v*«+v 在 W 中，（出）^是一个标量， 
c« 在 W 中，则//是V的一个子空间. 

习题 25-29 给出向童空间V的公理如何用来 
证明写在向董空间定义后面的基本性质,用合适的 
公理序号填空.由公理2、4和5可知，对所有《, 
0+«=«和一= 0均成立 • 

25. 完成下面关于零向量是惟一的证明，假设 h > 在 
V中，具有对V中所有《， M + M>=M>+“=“ 的 

性质，特别地， 0+N>=0, 但由公理_, 

0+H , = M» , MM H*=0+H-=0. 

26. 完成下面关于-«是7中惟一满足 „ + ( - „) = 0 
的向童的证明.假设 w 满足 „ + H >=0, 用-« 
加到两边，则有 

(-«) + [« + !*>]=：(-«) + 0 

[(- b )+«]+ m -=(-«) + 0 这是由公理_ (a) 

0+ h - = (-«) + 0 这是由公理_ (b) 

w =~ u 这是由公理_ ( c ) 

27. 在下列证明0«=0对任意V中的《成立的过 
程中，填写漏掉的公理序号. 

0« = (0+0 )h = 0 ii +0 ii 这是由公理_ (a) 

两边加0«的负向量： 

0 ii +(-0 m ) = [0« + 0 i < ]+(-0 m ) 

0« + (-Ow) = 0«+[0 h + (-Ok)] 

这是由公理_ ( b) 


这是由公理. 


0 = 0 « + 0 
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0 = 0u 这是由公理_ (d) 

28. 在下列证明 c0 = 0 对任意数 c 成立的过程中， 

填写漏掉的公理 序号： 

c0 = c(0 + 0) 这是由公理_ (a) 

= cO+cO 这是由公理_ (b) 

两边加 cO 的负 向量： 
c0+ (-cO) = [cO+c0] + (-cO) 
c0+ (-cO) = c0 + [cO+ (-cO)] 

这是由公理 _<c) 

0 = c0 + 0 这是由公理 _(d) 

0 = c0 这是由公理 _(e) 

29. 证明 （-1) u=-h .( 提示： 《 + (-l)« = 0, 用习题 
27 和习题 26 中某些公理和结论 .） 

30. 假设对某非零数 c，oi=0, 证明《=0,说出你用 
到的公理和性质. 

31. 令 《,v 是向量空间V中的向量， W 是V中任意 
—个包含《和 v 的子空间. 解释为什么 H 也包 
含 Span{«,v}, 这说明 Span{u,v} 是包 含“和 v 
的V中最小子空间. 

32. 令//和欠是向量空间V的子空间.//和 AT 的 
交集写成 wn/f, 是V中既属于《又 属于欠 
的元素的集合，证明// n 欠是 v 的一个子空间. 

( 见下图 .） 在 K 2 
中给出一个例子， 

证明一般而言，两 
个子空间的并集 
不是一个子空间. 

33. 给定向量空间V 
的子空间//和 A：, 

W 和的和 （记 
为 W+A：) 是V中 
可以写成两个向量（一个向童在//中，另一个 
向童在欠中）之和的所有向量的集合.即 

练习题答案 

1. 任取//中的比如取任取 Ml, 比如取 c 



H + K = { w:w = u + v , 其中 weW.vei：} 

a. 证明 W + X ■是V的子空间. 

b. 证明 W 是// +尺的子空间，欠是// +尺的子 
空间. 

34. 假设叫,…,!^和 v,, &是向釐空间V中的向 
量，并设 

f/ = Span(« 1 ,-u ( ,J I /r = Span{v,,--v,} 

证明 + *f = Span{u,,- -,u ( „v,,---,v,}. 

35. [M ] 证明在由 v,，v 2 ,v 3 生成的 K 4 的子空间 
中，这里 



36. [ M ] 判定 >是否在由4的列生成的 R 4 的子空 
间中，这里 



37. [M] 向童空间 // sSpanll.cos'cos^.cos 6 /} 至 
少包含两个有趣的函数，它们在以后的习题中 
用到： 

/(/) = 1 - 8cos 2 / +8cos 4 < 
g(f) = -1 +1 8cos 2 1 - 48cos 4 1 + 32 cos 6 1 
对 ( KW 2 n , 研究/的图像，对 / W 推测一 
个简单的公式，通过绘图比较1+/(0与你的 
/ W 的公式，验证你的猜测.（你将会看到常 
函数 1.) 对 irW 重复你的研究. 

38. [M] 对下列函数，重复习题 37. 

/(r) = 3sin/-4sin 3 / 
g(r) = l-8sin 2 / + 8sin 4 / 
h(t) = 5sin r - 20sin 3 / + 16sin 5 « 

它们均在向量空间 Span{l,sin«,sin 2 r,...,sin 5 r} 中. 


= 2, 则如果它在 V 中，则存在某 s 使得 
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UvK:] 

则 s = 2 同时 s = I2/5. 这是不可能的.所以2«不在 W 中， W 不是一个向量空间- 
2. v , = h> l+ 0v 2+ ... + 0v (; . 这表明 v, 是 v •，… .v, 的一个线性组合，所以 v, 在灰中，一般 》>* 也在 W 中，这是 
因为 v* =0v, + ■••+0v*. 1 +lv» +Ov*+i +… + 0v p . 

4.2 零空间、列空间和线性变换 

在线性代数的应用中， K ” 的子空间通常由以下两种方式产生 ：（ 1 ) 齐次线性方程组的解集； 
或 （2) 某些确定向量的线性组合的 集合. 本节中，我们比较和构造这两类子空间，体验子空间 
的概念.事实上，正如你将要看到的，我们从 1.3 节以来一直与子空间打交道，这里的主要新 
特征是术语.本节包括线性变换的值域与核的讨论. 

矩阵的零空间 
考虑下列齐次方程组 

=0 ( 1 ) 
一 5jC|+9«x 2 + 叉 3 =0 

用矩阵的方式.此方程组可写成 Ac = 0, 这里 



所有满足 （ 1 ) 的 Jt 的集合称为方程组 （ 1 ) 的解集，通常将这个解集直接与矩阵 A 和方程 Ar = 0 
联系起来是方便的，我们称满足如= 0的所有 jc 的集合为矩阵 A 的零空间. 

定义 mx/i 矩阵 A 的零空间写成 NulA ， 是齐次方程 办= 0的全体解的集合，用集合符号 
表示，即 

NulA = {x:xeR",Ar = 0) 

Nul A 的更进一步的描述为 R" 中在线性变换 x B /U 下映射到 R" 中的零向量的全体向量的 
集合，见图 4-11. 



图 4-11 


5" 

例1设 A 为 （2) 式中所示，令3 ,确定 II 是否属于 A 的零空间. 
一2 
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解 为验证《是否满足>1«=0,简单计算 


Au =\ 


-3-2 


-5 9 


5- 9 + 4 
-25 + 27 


+ 41 「01 
-2」=|_0_ 


所以 weNulA . ■ 

空间这个词用在零空间上是合适的，因为一个矩阵的零空间是一个向量空间，在下列定理 
中会见到. 


定理2 mxn 矩阵 A 的零空间是『的一个子空间，等价地， m 个方程、 n 个未知数的齐次 
线性方程组 Ax =0的全体解的集合是 R" 的一个子空间. 

证由于 A 有 n 个列， NulA 当然是 1 T 的一个子集，我们必须证明 Nul A 满足子空间的3 
个性质.❶当然在 NuM 中，其次令《和 v 表示 Nul A 中任意两个向量，则 
Aw =❶ Av =❶ 

为证 ii + v 在 NulA 中，必须证 A(ii + v ) = 0. 利用矩阵乘法的性质，有 
A(u + v ) = /4« + _Av = 0 + 0 = 0 

从而 《 + veNulA , 于是 NulA 对向量加法是封闭的.最后，若 c 是任意一个数，则 
A ( cu ) = c ( Au ) = c (0) =❶ 

从而 caeNulA ， 于是 NulA 是 R " 的一个子 空间. ■ 

例2令//是 R 4 中坐标 a , fc , c , d 满足方程 a -2 fc + 5 c = d 且 c-a = fc 的所有向量的集合，证明 
W 是 R 4 的一个子空间. 

解 通过重新调整描述//的元素的方程组，我们发现//即下列齐次线性方程组的 解集： 
a -2 b + 5 c-d =0 
- a-b + c = 0 

由定理2, //是 R 4 的一个子空间. ■ 

确定集合//的线性方程组是齐次的这个条件是很重要的，否则，其解集不能确定一个子空 
间（因为零向量不是非齐次方程组的解），而且在某些情形下，解集可能是空集. 


Nul 々的一个显式刻画 


NulA 中的向量与 A 中的数值之间没有明显的关系.我们称 NulA 被隐式地定义，这是由于 
它被一个必须要检验的条件所定义，没有明确地给出 NulA 中元素.然而，当我们解出方程 
知=0,我们就得到 NulA 的显式刻画，让我们先复习一下 1.5 节中已有的解题步骤. 

例3求矩阵 A 的零空间的生成集，其中 

'-3 6-1 1 -1 

A = 1 -2 2 3 -1 

_ 2 -4 5 8 -4_ 

解 第一步是求的关于自由变量的通解，通过行化简增广矩阵 [A 0] 化为简化阶梯 
形矩阵为 
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-2 0 

-1 3 

0] 

A - 2戈2 

- jc 4 + 3戈 5 = 0 

0 1 

2 -2 

0 


+ 2 a : 4 — 2 x$ — 0 

0 0 

0 0 

0 


0 = 0 


通解为 A = 2 jc 2 + JC 4 - 3 jc 5 ， x 3 = -2 xt + 2 a : W 4 ， A 是自由变量. 

其次，将通解给出的向量分解为向量组合，用自由变量作权，即： 



Al LoJ U 

t 个 I 

u v W 


«， v 和 w 的每一个线性组合都是 NulA 中的一个元素，从而 {«, v , w } 是 NulA 的一个生 成集. ■ 
关于例3的解应该得到以下两点事实，它们对所有此类问题均适合，我们将在后面用到 • 

1. 由例3中的方法产生的生成集必然是线性无关的，这是因为自由变量是生成向量上的权 • 
比如，见 （ 3) 式中解向量的第2, 4, 5个数，注意到只有当 AAA 全为零 Wam + Av + aw 为 
零. 

2. NulA 的生成集中向量的个数等于方程心:= 0中自由变量的个数 • 

矩阵的列空间 

与矩阵相关的另一个重要的子空间是它的列 空间. 与零空间不同，列空间可以由向量的线 
性组合显式定义. 

定义 mxn 矩阵的列空间（记为 ColA ) 是由 A 的列的所有线性组合组成的集合，若 
4 = 1x1 , ，…，< 1 „] ’ 則 ColA = Span { a 1 , -, a B } - 

由于 C 0 lA = Span { fll 是一个子空间，由定理1及 Col A 的定义和 A 的列在 R m 中这一 
事实得到以下定理. 

定理 3 mxn 矩阵 A 的列空间是 R m 的一个子空间 • 

注意到 Col A 中一个典型向量可写成 /4 x 的形式，其中 JC 为某向量，因为记号 Ax 表示 A 的 
列向量的一个线性组合，即 

ColA = {b:b = Ax,xeW} 

代表 Col A 中向量的记号 /4 x 也表明 Col A 是线性变换 jch ^/ U : 的值域，我们将在本节的最后讨论 
这个问题. 

例4求一个矩阵 A , 使得 W = ColA . 
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W a+b :a,*eR 


解首先将 W 写成线性组合的集合 


1 : a,*eK^ = SpanJ 


其次，用生成集中的向量作为 A 的列，令 a : 



A 为所求矩阵. ■ 

回顾 I . 4 节中的定理 4 , A 的列生成 R " 当且仅当方程 Ar =6对任一个 ft 有解，我们可以按 
下列方式重述这一事实. 



NulA 与 COM 之间的对比 

—个矩阵的零空间和列空间之间的关系如何是一个自然的问题，事实上，这两个空间是很 
不一样的，从例 5-7 中将看到这 一点. 然而，这两个空间之间的一个令人感到意外的关联将出 
现在 4.6 节中，这需要用到更多的理论. 

' 2 4 -2 I 

例5令4= -2 -5 7 3. 

3 7-8 6 

a . 若 A 的列空间是的一个子空间， it 是多少？ 

b . 若 A 的零空间是 R * 的一个子空间， it 是多少？ 

解 a . A 的每一列含有3个数，所以 Col A 是 R 3 的一个子空间. 

b . 使得 Ac 有定义的一个向量 jc 必须有 4 个数.所以 NulA 是的一个子空间. ■ 

当一个矩阵不是方阵时，比如例 5 中的矩阵， NulA 中的向量与 Col A 中的向量分别在完全 
不同的“域”中.例如，我们已讨论过 R 3 中向量的线性组合不能产生 nr 中的一个向量.当 A 为方 
阵时， NuM 和 CoM 确实都具有零向量，并且在特殊情形下它们可能具有一些相同的非零 向量. 
例 6 对例 5 中的 A ，分别找出 ColA 和 NulA 中的一个非零向量. 

解容易找到 CoM 中的一个向量， A 的任一个列都可以，比如 -2 ，为了找到 NulA 中的 

3 

一个非零向量，我们已作了一些工作，将增广矩阵 U 0] 行化简，得 

1 0 9 0 0" 

[A 0]- 0 1 -5 0 0 
0 0 0 1 0 
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从而若 jc 满足 Ac = 0， 则； c ,=-9; c 3 ,; c 2 =5; c 3 ， j : 4 =( U 3 是自由变量， x 3 取一个非零值，比如 
4=1，我们得到 NuM 中一个向量，即 x = (-9,5， l ，0). ■ 

3 1 [ 3] 

-2 

例 7对例5中的4，令《= ， v = -1 . 

o L 3 — 


a. 判定 《 是否在 Nul4 中， 《 是否在 CoM*. 

b. 判定 v 是否在 Col4 中， v 是否在 NuM 中 • 

解 a. 这里不需要 Nul 4的一个显式刻画，简单地计算乘积 


Au = 


" 2 4 

-2 1' 


" 3" 

-2 

1 




0 _ 

-2 -5 

7 3 


= 

-3| 


0 

_ 3 7 

-8 6 


—1 

0 


[ 3 J 


0 


显然，《不是 = 0 的一个解，所以《不在 NuM 中，由于 CoM 是 R 3 的一个子空间，《具 
有4个数值，《不可能在 ColA 中. 


b. 将 U v] 简化成阶梯形 



_ 2 

4 

-2 1 

3" 


■2 

4 -2 

1 3' 

U v]= 

-2 

—5 

7 3 

-1 


0 

1 -5 

-4 —2 


_ 3 

7 

-8 6 

3_ 


0 

0 0 

17 1 


由此可见，方程是相容的，所以 v 在 ColA 中，由于 NulA 是 R 4 的子空间， v 具有3 
个数值， v 不可能在 NulA 中. ■ 


表 4-1 可以作为我们已经学过的关于 NuM 与 CoM 的一个总结.其中的第8条是 1.9 节中定 


理11和定理12 (a) 的另一种形式. 


表 4-1 对 mxn 矩阵 A， Nul A 与 Col A 之间的对比 

NulA Col A 


1. NulA 是 R" 的一个子空间. 

2. NulA 是隐式定义的，即仅给出了一个 NulA 中向 
量必须满足的条件（处 = 0). 

3. 求 NulA 中的向量需要时间，需要对 [A 0] 做行变换. 

4. NuM 与 A 的数值之间没有明显的关系. 

5. NulA 中的一个典型向量 v 具有 Av=0 的性质. 

6. 给一个特定的向量 v ,容易判断 v 是否在 NulA 中， 
仅需计算办. 

7. NulA = {0} 当且仅当方程处仅有一个平凡解. 

8. NulA = {0} 当且仅当线性变换 处 是一对一的. 


1. ColA 是 R" 的一个子空间. 

2. ColA 是显式定义，即明确指出如何建立 CoM 中的向 

量. 

3. 容易求出 ColA 中的向量, A 中的列就是 ColA 中的向量， 
其余的可由 A 的列表示出来. 

4. CoM 与 A 的数值之间有明显的关系，因为 A 的列就在 
CoM 中. 

5. CoM 中一个典型向量 v 具有方程 Ar = vS 相容的性质. 

6. 给一个特定的向量 v ，弄清 v 是否在 ColA 中需要时间， 
需要对 [A v] 作行变换. 

7. ColA = R m 当且仅当方程对每一个 Aesr 有一 
个解. 

8. CoM = 5 T 当且仅当线性变换将 『映 上到 ET . 
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线性变换的核与值域 

我们经常需要用线性变换而不是矩阵来描述除 R ” 以外的向量空间的子空间，为了更准确， 
将 1.8 节中给出的定义进行推广. 

定义由向量空间 V映射到向量空间 VV 内的线 性变换 r 是一个规则，它将V中每个向量 JC 
映射成 vv 中惟一向量 r ( jc )， 且 满足： 

( i ) T(u + v ) = T ( u )+ T ( v ), 对 V 中所有 均成立. 

( ii ) 7-(01) = 07-(11), 对 V 中所有 h 及所有数 c 均成立. 


线性变换 r 的核（或零 空间） 是 V 中所有满足 r(«)=o 的向量《的集合 （ 0 为 VV 中的零向 
童）. r 的值域是 VV 中所有具有形式 r ( jc ) (任意 JC€V ) 的向量的集合.如果 r 是由一个矩阵变 
换得到的，比如对某矩阵 A , r ( jc ) = / u , 则 r 的核与值域恰好是前面定义的 a 的零空间和列空 
间. 

不难证明 r 的核是 v 的一个子空间 • 证明在本质上与定理2相同， r 的值域也是 w 的一个 
子空间.见图 4-12 和习题 30. 



图 4-12 与线性变换相关的子空间 


在应用中，一个子空间往往由一个适当的线性变换的核或值域产生，比如，一个齐次线性 
微分方程的全部解的集合被判明是一个线性变换的核.典型地，这样一个线性变换用关于一个 
函数的一阶或髙阶导数描述.要解释这个结论将使我们远离主题，所以我们仅给出两个例子， 
第-个例子解释微分运算为什么是一个线性变换. 

例8 ( 需要微积分的知识）令 V 是定义在区间上的所有连续可导的实函数构成的向 
量空间，令 VV 是 [ fl ， fc ] 上所有连续函数构成的向童空间，且令是将 V 中/变为其导数 
/' 的变换，由微积分中两个简单的微分法则有 

D(f + g) = D{f) + D(g) , D(cf) = cD{f) 

于是， D 是一个线性变换，可以证明 D 的核是 [ fl ， fc ] 上的常函数的集合， Z ? 的值域是 [ fl ， fc ] 上所 
有连续函数的集合 W . H 

例9 ( 需要微积分的知识）微分方程 

;y’+fi) 2 ;y = 0 (4) 

这里 ft ) 是常数，常常用来描述物理系统的一个变化过程，比如负重弹簧的振动，摆的运动，以 
及电感-电容电路中的电压 .（4) 的解集恰好是将函数 y = /(0 映成函数/»+0) 2 /(0的线性变 
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换的核.寻找这个向量空间的一个显式刻画是微分方程方面的一个问题.其解集结果是 4.1 节 

习题19中所说的空间. 


■ 

练习题 



1. 令 W =. 6 : a -3 fc-c = 0 ,用两种不同的方法证明 W 是 R 3 的一个子空间.（用两个定理 .） 

「7 -3 51 「21 「71 



2. 令 A = -4 1 -5， v = 1 ， w = 6，假设已知方程 Ac = v»Ac = w 都是相容的，关于方程 

L -5 2 -4 J L-lJ L -3 J 



Ar = v + w ,你能得出什么结果？ 



习题 4.2 



1" 

它不是一个向量空间. 

1. 判定 w = 3是否在 NuM 中，这里 


M | 

- A _ 

7. - 

b : a ^ b-¥c = l \ 

' 3 -5 -3' 


IU J 

A = 6 -2 0 


f「 r l 1 

-8 4 1 

S ' 

8. ^ 

IU ] 

J 

2. 判定 w = -3 是否在 NuM 中，这里 


\'a 1 

_ 2 


| b a - = 4 c 1 

■ 5 21 19， 

9. •< 

I c 2 a = c ^3 d \ 

A = 13 23 2 

| 

d 

8 14 1 


l J J 

a 1 

在习题3~6中，通过求出张成零空间的向量， 


b a + 3 b = c 1 

求出 NulA 的一个显式表示. 

10. 

c b ^ c -^ a-dl 

「1 3 5 01 


d 

3. A = 


LL “」 J 

_0 1 4 -2] 


\ b -2 d ~\ 

A ,[1 -6 4 0] 


5 + d 

4. A = 

0 0 2 0」 

11. 

b + 3 d 太 d 为实数 

'1 -2 0 4 O ' 


l _ 4 j 

5. A = 0 0 1—90 


\ b -5 d '] 

0 0 0 0 1 


2b 


12. 

j〆 为实数 

'15-4-3 r 


2^ + 1 

6. A= 0 1 -2 10 


[_ d J 

0 0 0 0 0 


「 c -6 叫 

在习题 7~14 中，或者利用一个适当的定理证 

13. 

d : 为实数 

明给出的集合 W 是一个向量空间，或者举例说明 


c 
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-a + 2b 
a-2b 
3a-6b 


aj 为实数 


15. 


在习题 15 和习题 16 中，求 4 使得给出的集合 
为 CoM. 

2^ + 3t 
r + s -2 t ] 

4 r + 5 
3r-s-t 
b-c 

\2b + c^d\ 

5c-4d 
d 

对习题 17-20 中的矩阵 ,（a ) 求 々使得 NuM 是 
it 的一个子空间， （b) 求 々使得 com 是 r 的一 
个子空间. 


为实数 


为实数 


18. A = 


19. A = 


-2 0 
-2 0-5 

0-5 7 

I -5 7 -2_ 

-2 6 01 
0 1 oj 

20. A = [l -3 9 0 -5] 

21. 对习题 17 中的 A, 分别求 NulA 和 ColA 中的 
一 个非零向量. 

22. 对习题3中的/!，分别求 NuM 和 CoM 中的一 
个非零向量. 

—-6 


23. 令 A = | 


-3 


12 ] [2 
6 J’ w= k 


中， h ■是否在 NulA 中. 


24. 令 A = | 

■-8 -2 - 9 _ 
6 4 8! 


" 2 

1 


4 0 4」 


-2 


判断 w 是否在 Col /4 


判定 w 是否在 


ColA 中， H ■是否在 NulA 中. 


在习题25和习题26中，表 7 K —■个 mxn 矩 
阵.对每个命题判断真假，给出理由. 

25. a . A 的零空间是方程 Ar =0 的解集. 

b . mxn 矩阵的零空间包含在 IT 中. 

c . A 的列空间是映射 jc 4 Ar 的值域. 

d . 若方程如=6是相容的，则 coi 就是 nr . 

e . 一个线性变换的核是一个向量空间. 

f . Col / l 是对某 x 所有能写成 Ar 的向量的集 
合. 

26. a . 零空间是向量空间. 

b . mxn 矩阵的列空间包含在 IT 中. 

c . ColA 是 Ar =6 的所有解的集合. 

d . NuM 是映射 x 4 Ac 的核. 

e . 一个线性变换的值域是一个向量空间. 

f . 一个齐次线性微分方程的所有解的集合是 
一个线性变换的核. 

27. 可以证明下列方程组的一组解为 
Xl = 3 , x 2 = 2 , x,=-l . 利用本节中的理论解释 
为什么； c , =30，心= 20,4 = -10是另一组解（观 
察这两组解之间的关系，不要作另外的计算）. 

A — 3_ t 2 — 3 xi = 0 
— + 4a ：2 + 2 jc 3 = 0 
-x^ + 5x 2 +7j: 3 =0 

28. 考察下列两个方 程组： 

5x { + x 2 - 3 j : 3 = 0 5 a ：! + x 2 -3x^= 0 

—9xi + 2x 2 + 5x^ = 1 —9xi+2x2+5x2= 5 

4a：i + x 2 -6x^=9 4j：i + x 2 - 6 x 2 = 45 
可以证明第一个方程组有解，利用这个事实和 
本节中的理论解释为什么第二个方程组一定也有 
解.（不要作行变换 .） 

29. 定理3的证明 如下： 给一个 mxn 矩阵 A ， Col /4 
中任一元素均为形如 Ar ^ eR " 的形式.令 Ar 
和 Aw 分别为 Col /!中任意两个元素. 

a . 解释为什么零向量在 Col /4 中. 

b . 证明向量 Ar + Aw 在 CoM 中. 

c . 给一数 c ， 证明 c ( Ar ) 在 CoM 中. 

30. 令4 W 是一个从向量空间 V 到向量空间 
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vv 中的线性变换，证明 r 的值域是 w 的一个 
子空间.（提 示： 值域中的典型元素具有形式 
rco 和 rov ) ，其中 aw 属于 v .) 

31. 定义 r : p 2 -> R 2 ， r ( p ) = d 比如，若 


p ( f ) = 3 + 5 f + 7 f 2 , 则 r ( p ) = 



a . 证明 r 是一个线性变换.（提 示：对 P 2 中的 
任意多项式 p ， g ， 计算 r ( p + 的和 r ( q »).) 

b . 求1» 2 中的一个多项式 p 使之生成 r 的核并 
刻画 r 的值域. 


32. 由_七; 0 0 ;]定义-个线性娜一 


求 p 2 中多项式 P , 和 p 2 ，使之生成 r 的核并刻 


画 r 的值域. 

33. 令是所有 2 x 2 矩阵组成的向量空间，定 
义 7' : M 2 x 2 4 M 2 x 2 ,7'(/ l ) = /l + / r ， 这里 



a . 证明 T 是一个线性变换. 

b . 设中任一个满足 S T = S 的矩阵， 
求財况中的矩阵/!使得 T ( A ) = B . 

c . 证明 r 的值域是中满足性质 s T = s 的 
S 的集合. 

d . 给出 r 的核. 

34.( 需要微积分的知识 ） 定义 r : C [0， l ]4 C [0， l ] 如 


下:对 / ec [0， l ] ，令 r (/) 是/的满足 f (0) = 0 
的原函数.证明 r 是一个线性变换并刻画 r 


的核. 

35. 令 v 和 w 为向量空间，令是一个线 
性变换，给 v 的一子空间 "， 令 r ([/) 表示所 
有形如 r ( x ) 的像的集合，这里 x 在[/中，证 
明 r ([/) 是 w 的一个子空间. 


36. 已知与35题中相同，给 w 的一子空 
间 z , 令[/是 v 中所有使得在 z 中的 x 
的集合.证明[/是 v 的一个子空间. 

37. [ M ] 判定 w 是否在/!的列空间中，是否在 A 的 
零空间中，或同时在两个空间中，这里 


1 


■7 6-4 1' 

1 

, A = 

-5-1 0-2 

-1 


9-11 7-3 

-3 


19-9 7 1 


38. [ M ] 判定 w 是否在/!的列空间中，是否在 A 的 
零空间中，或同时在两个空间中，这里 


l ' 


-8 

5 

-2 0" 

2 

, A = 

-5 

2 

1 -2 

1 


10 

-8 

6 -3 

0 


3 

-2 

1 0 


39. [ M ]，％ ，…, a 5 表示矩阵 A 的列，这里 


'5 1 2 2 0' 

3 3 2 -1 -12 

8 4 4 -5 12 

2.11 0 —2 


S = [«i a 2 a 4 ] 


a . 解释为什么《 3 和1 5 在3的列空间中. 

b . 求生成 Nul A 的向量的集合. 

c . 令 r : R 5 4 R 4 定义为 r (; t ) = Ar ，解释为什 
么 T 既不是一一的又不是到上的. 

40. [1\1]令 W sSpanfVbV !} ， [ = Span { v 3 ， v 4 } ，其中 



•5. 


r 


' 2 


' O ' 

Vi = 

3 

, v 2 = 

3 

， V 3 = 

-1 

， v 4 = 

-12 


8 


4 


5 


-28 


则 H 和夂是 R 3 的子空间.事实上，//和欠是 
K 3 中通过原点的平面，二者相交于一条过原 
点的直线，求一个非零向量 w ，使之生成这条直 
线 •（ 提示： W 可写成 AVi +c 2 v 2 ,也可写成 c 3 v 3 + 
c 4 v 4 ,为求 )V ,对未知的 (;' = 1 ,2 ,3 ,4) , 
解方程 <：,«>, +C 2 V 2 = C3V3 + C 4 v 4 . ) 
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练习题答案 

1. 方法1:因为 W 是一个齐次线性方程组的全部解的集合，由定理2, VV 是 R 3 的一子空间（这里方程组 
仅有一个方程）.等价地， W 是 1 x 3 矩阵/4 = [1 -3 -1] 的零空间. 

[3叫 

方法2:以为自由变量解方程 a -3 <>- c = 0 ，任意解具有形式 ，这里是任意常数，且 


'3^ + c " 


'3' 


V 

b 

=b 

1 


0 

. c _ 


0 


l 


Vl v 2 

计算表明 VVsSpant ^ iM ，从而由定理1知 W 是 R 3 的一个子空间，我们还可以 a , c 或 a j 为自由变量 
解方程 a -3 fc-c = 0 ，得到 W 作为两个向量的线性组合的集合的不同刻画. 

2 - v 和 w 都在 CoM 中，因 CoM 是一个向量空间 ， v + w —定在 ColA 中，即方程 Ar = v + w 是相容的. 

4.3 线性无关集和基 

本节我们确认并研究尽可能“有效率地”生成一个向量空间 v 或一个子空间的子集，关 
键的思想是线性无关，与定义在 IT 中的线性无关一样. ’ 

V 中向量的一个指标集悅,，••，％}称为是线性无关的，如果向量方程 

研 +㈣ 十 … + c p v p =0 ( 1 ) 

只有平凡解，即0=0，...，£^=0. 0 

集合 { v , ，…， v p } 称为线性相关，如果 （1) 有一个非平凡的解，即存在某些权 Cl ,.. •心不全为 
零，使得 （ 1 ) 式成立，此时 （ 1 ) 式称为 v , ，…， v p 之间的一个线性相关关系 • 

与 R " 中一样，一个仅含一个向量 v 的集是线性无关的当且仅当 V 5 t 0; —个仅含两个向量 
的集合是线性相关的当且仅当其中一个向量是另一个的倍数；任何含有零向量的集合是线性相 
关的. 下列定理与 1.6 节中定理7证法相同. 

定理4不少于两个有编号的向量的集合 { Vl ，...， Vp }， 如果有 Vl 5 t 0 ， 则 { Vl ，...， Vp } 是线性相 
关的，当且仅当某是其前面向量的线性组合. 

一般向量空间中的线性相关与 IT 中的线性相关的主要不同点在于当向量不是„元数组时， 
齐次方程 （ 1 ) 通常不能被写成一个 n 元线性方程组•换句话说，为了研究方程如 = 0，向量不 
能从一个矩阵 A 的列中得到，取而代之的是我们必须要依靠线性相关的定义和定理 4 . 

例1令/»,(0 = 1，/> 2 (0 =化(0 = 4-?，则由于 /； 3 =4;>,-/» 2 ,从而 hn } 是线性相 关的. 


㊀在 U ) 中用 Cl .…,表示标量而代替如第丨章中用过的 々，… 是方便的. 
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例 2集合{如?，0)叫在(：[0,1]中是线性无关的，这是因为作为<：[0，1]中的向量，8^和0^ 
中任一个均不是另一个的 倍数. 即不存在数 c 使得 cosr = c.sinf 对任意 f e [0，1] 均成立（见 shu 和 
cosf 的图 像）. 然而， { shucosf ， sin 2 f } 是线性相关的，这是因为有 sin 2 f = 2 shucosf , 对任意 
fe [0， l ] 均成立. ■ 

定义 令是向量空间 V 的一个子空间， V 中向量的指标集 6 = {私,...，~} 称为 《 的一个 


基，如果 

( i ) 6 是一线性无关集. 

( ii ) 由 6 生成的子空 间与孖 相同，即 《=Span 冰 ，…， A p } 


因为任一个向量空间都是其自身的子空间，所以基的定义也可用在的情形，因而 V 的 
一个基是生成 V 的一个线性无 关集. 注意到当时，条件 （ ii ) 蕴涵私中每个向量都 
属于因为正如 4.1 节中所见， Span 汍 ，…，~}包含&,，〜,&• 

例3令 A 是一个可逆的矩阵，即 A = [ fll … < i „], 则由可逆矩阵定理， A 的列组成 R " 
的一个基，这是因为它们是线性无关的且它们可以生成_ 
例4令 e ,， …,是单位矩阵/„的列，即 



T 


■01 


"0" 

e \ = 

0 

, e 2 = 

1 

〆 *•，«« = 

0 


0 


0 


1 


集合 M ，…, e „} 称为 R " 的标准基（图 4-13). 




" 3" 


~4 


-2" 

例5令 v , = 

0 

-6 

， v 2 = 

1 

7 

， v 3 = 

1 

5- 


，判断 { v ,, v 2 , v 3 } 是否是 R 3 的一个基. 


解 因中的3个向量，我们可以用几种方法判定矩阵 A = [ v , v 2 v 3 ] 是否可逆， 
比如通过简单计算得 detA = 6#0, 从而 A 可逆.与例3相同， A 的列是 R 3 的一个基. ■ 

例6令5 = {1," 2 ,•••/}，证明 S 是 P , 的一个基，此基称为1?„的标准基 • 

解 显然 S 生成 P „， 为证 S 是线性无关的，假设 c 。， …， c „ 满足 
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c 0 - l + cv + c 2 r 2 +-“+ c „ r * =0( f ) (2) 

此式表明左边的多项式与右边的零多项式具有相同的值，由代数的基本定理知， P „ 中的多项式 
若有多于”个的根则此多项式一定为零多项式，即 （2) 对任意 r 只有当 c n f = c „=0 时成立， 
于是证明 S 是线性无关的且是 IP ； ■的一 个基，见图 4-14. 


图 4*14 P 2 的标准 



涉及 P „ 中线性无关和生成的问题，用 4.4 节中讨论的技巧处理最合适. 
生成集定理 


正如将要看到的，一个基是一个不包含不必要的向量的“高效率”的生成集.事实上 ，一 
个基可以通过由一个生成集中去掉不需要的向量构造出来. 


例7 


令 V ,= 


_ 0 


'2 


' 6 

2 

, v 2 = 

2 

， v 3 = 

16 

-1 


0 


-5 


, f /= Span { v „ v 2 , v 3 } ,注意 


到 v 3 =5 v ,+3 v 2 , 证明 Spanlvi . VhVshSpan ^ VbVd ，然后求子空间 


H 的一个基. 

解因为 CA + C2V2 =0^2+加 3 ，所以 Spanlv ,，!^} 中每个 
向量都在//中，现令 Jt 为//中任一向量， BPjc = ^,+^ 2 +0 3 ^, 
因 v 3 =5 v ,+3 v 2 , 代人得 


X = C | V , + C2V2 + c 3 (5 vi +3 v 2 ) 



= ( c , +5 c 3 ) v , +( c 2 +3 c 3 ) v 2 

于是 x 在 Span { v ,, v 2 } 中，从而 W 中每个向量属于 Span { v ,， v 2 }, 于是//与 Span { v ,, v 2 } 相同， 
又由于 { v ,， v 2 } 显然是线性无关的，所以…， V 2 } 是//的一个基. I 

下一个定理推广了例 7. 


定理5 (生成集定理） 

令 S = { vi ， …, v p } 是 V 中的向量集，// = Span { v 1 ,---, v J( }. 

a - 若 S 中某一个向量，比如说是 S 中其余向量的线性组合，则 S 中去掉 V ,后形成的集 
合仍然可以生成// . 
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b . 若《*{0},则 S 的某一子集是//的一个基. 

证 

a . 若必要的话，可以重排 S 中向量的顺序，这样可以假设是 v ,, …， tv , 的线性组合，即 

v p = a x Vi + ••• + a p _, v p _ l (3) 

任给//中向量 jc , 取适当的数 JC 可写成 

JC = C.V, + • • • + Cp-.Vp-, + c p v p (4) 

将 （3) 中 v p 的表达式代人 （4) 式，易见 jcSv , ，… ,1 V , 的线性组合.由于 jc 是//中任一元素， 
所以生成// . 

b . 若原来的生成集 S 是线性无关的，则它已经是//的一个基.若不然， S 中某一个向量可 
表示成其余向量的线性组合，则由 （ a ) 该向量可去掉.这样生成集中只要还有两个或更多的向 
量，我们就可以重复上述过程，直到这个生成集是线性无关，从而是//的一个基.假如生成集 
最终被缩减到一个向量，则该向量是非零向量（从而是线性无关的），因为_ 


NulZ 和 Co\A 的基 


我们已经知道如何求能够生成一个矩阵4的零空间的向量了， 4.2 节中的讨论指出我们的 
方法总可以产生一个线性无关集，从而由该方法可以得到 Nul /4 的一个基. 

下面两个例子给出对列空间求基的简单算法. 

例8求 Col 的一个基，这里 


B = [bi b 2 


A 5 ] = 


■1 4 0 2 0" 

0 0 1-10 
0 0 0 0 1 

0 0 0 0 0 


解的每个非主元列是主元列的线性组合，事实上， b 2 =4 b u b 4 =2^- b 3 . 
由生成集定理，可以去 掉込和 A 4 , { A ,， A 3 ， A 5 } 仍可以生成 Colfl , 令 


'[1] [0] [O' 

5={A,,A 3 ,*5}= q . q . ^ 

L°J L°J L°. 

因为私 #0, 同时 S 中的向量都不是其前面向量的线性组合，所以 S 是线性无关的（定理4)， 
从而 S 是 Col B 的一个基. _ 

一个矩阵>1若不是简化阶梯形将如何？回顾4的列中任何线性相关关系都可以用 Ac = 0的 
形式刻画，这里 I 是一个加权的列•（若某些列没有被包括在一特殊的相关关系中，则它们的权 
为零 •） 当>1被行化简成矩阵时，的列通常与4的列完全不同旁然而，方程如= 0与 &c = 0 
有完全相同的解集， 即4的列与的列 具有完全相同的线性相关关系. 


矩阵的行初等变换不影响矩阵的列的线性相关关系. 
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例9可以证明矩阵 


A = [fli a 2 ••* fl 5 ] = 

2 

_5 

行等价于例8中的矩阵 fi ， 求 Col A 的一个基. 

解在例8中，易见 


4 0 2 
12 1 5 
8 1 3 
20 2 8 


2 

8 _ 


所以可以得到 


= 4 *! ， b 4 =2bi-b 3 
a 2 = 4a x , fl 4 = - a 3 


经检验，这是对的，从而在挑选 ColA 的最小生成集时，可以去掉心和〜事实上， { fl „ fl 3, fl 5 } 
一定是线性无关的，这是因为间的任何线性相关关系都蕴涵私為 為之 间的一个线性 
相关关系，但我们已知是一个线性无关集，于是 { fll , fl 3 ， fl 5 } 是 Col /4 的一个基，此基中 


我们选取的列是 A 的主元列. 


例8和例9说明了下列有用的事实. 


定理6矩阵 A 的主元列构成 ColA 的一个基. 

证一般的证明用到上面讨论的论证，令是 A 的简化阶梯形，由于的主元列中的任一 
个向量都不是其前面主元列的线性组合，故 fi 中的主元列是线性无关的.又由 A 行等价于 A 
中列的任何线性相关关系对应中列的线性相关关系，所以4中的主元列也是线性无关的.同 
理， A 中每个非主元列是 A 中主元列的线性组合，由生成集定理，/4中非主元列可以从 Col A 的 
生成集中去掉，剩下的 A 的主元列是 Col /4 的一个基. _ 

警告对 ColA 的基，要慎重使用4本身的主元列，阶梯形的主元列通常不在 A 的 
列空间中，比如，例8中的列最后一个数字均为零，所以它们不能生成例9中 A 的 
列空间. 

关于基的两点观察 

使用生成集定理时，从生成集中删除向量，当集合变成线性无关时必须停止，因为如果再 
多删一个向量，该向量将不是剩下向量的线性组合，从而这个较小的集合将不再生成,所以 
一个基是一个尽可能小的生成集. 

基还是尽可能大的线性无关集，若 S 是 V 的一个基，在 S 中再添加进一个新的向量，比如 
是从 V 中取的一个 w ， 则新的集合不再是线性无关了，这是因为 S 生成 V ，因此 w 是 S 中元素 
的线性组合. 

例10下列 R 3 中的三个集合说明一个线性无关集如何被扩充为一个基，同时进一步的扩充如 
何破坏这个集合的线性无关性.再者，一个生成集可以收缩成一个基，但进一步的收缩就破坏 
了生成性. 
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rii [21) rl] pi ["41 1 

0,3 0,3,5 

LoJ [oj [oj [oj [6J ] 

线性无关，但 K 3 的一个基 

不能生成 K 3 


- 1]卩] ["4] p "! 1 
0 ’ 3，5，8 

oj [oj L 6 J MJ 

生成 K 3 , 但线性相关 


练习题 



1" 


_ -2. 

1. 令 V,= 

-2 

， v 2 = 

7 


■ 3」 


-9 


r 


' 6 

2. 令 v,= 

-3 

， v 2 = 

2 


4 


-1 


令 v, = 


，判断是否是 R 3 的一个基， {v u v 2 } 是否是 R 2 的一个基. 

，求由 {v,,v 2 ,v 3 ,v 4 } 生成的子空间 W 的一个基. 

知好中每一个向量都是 Vl 和 v 2 的线性组 


" 2 


- 2 

， V 4 = 




V 


0" 


s 

I 

S 


V 


"O' 

°l 


1 

， H = 

s 

: ■seR} •，因为 

S \ 

= S 

0 

+ 5 

1 

LoJ 

1 



0 」 

J 

[oj 




0 


合，问 {v,，v 2 } 是好的一个基吗？ 

习题 4.3 

判断习题1~8中哪一个集合是 R 2 或 R 3 的基， 
在不是基的集合中，判断哪一个是线性无关的，哪 
一个能生成 R 2 或 R 3 , 证明你的答案. 

0 


11. 求 IR 3 中平面; c+2;y + z = 0 中向量的集合的一 
个基.（提 示： 将该方程视为一个齐次线性方 
程组 .） 

12. 求 R 2 中直线 >> = 5;c 上向量的集合的一个基. 
在习题13~14中，假设>1行等价于5,求 NuM 



"-2 4 -2 -A 


"1 0 6 5' 

13. A = 

2-6-3 1 

， H 

0 2 5 3 

i 

-3 8 2 -3」 

1 

0 0 0 0 


14. A： 


对习题9~10中的矩阵，求其零空间的基， 


「1 2 -5 11 -3] 「1 2 0 4 5 

4 -5 15 2 0 0 5 -7 8 

2 0 4 5’~000 0 -9 

6 -5 19 -2J [° 0 0 0 0 

在习题15〜18中，求由给出向量 Vl ，...，v 5 生成 
的空间的一个基. 


4.2 节中例 3 下面的讨论. 




1 


' O' 


-3" 


1" 


' 2 

"1 0 

-3 

2 - 


■10-5 1 

4 

15. 

0 


1 


-4 


-3 


1 

0 1 

-5 

4 

10. 

-2 1 6-2 

-2 

-3 


2 


1 


-8 


-6 

3 -2 

1 

-2」 


0 2-8 1 

J 


2. 


w 


6 


u」 


9 
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丫 


'-2 


6' 


' 5" 


' 0' 

0 


1 


-1 


-3 


3 

0 


-1 


2 


3 

’ 

-1 

1 


1 


[-iJ 


-4 


1 


" 8' 


' 4" 


-f 


' 6 _ 


'-1' 

9 


5 


-4 


8 


4 

- 3 

’ 

1 


-9 


4 


11 

-6 


-4 


6 


-7 


-8 

0 


.4」 


-7 


10 


-7_ 

'-8' 


8" 


-8' 


r 


-9 

7 


-7 


7 


4 


3 

6 


-9 


4 


9 


-4 

5 


-5 


5 


6 


-1 

-7_ 


7. 


_-7_ 


_-7_ 


. 0 


19. 令 v , = 

" 4" 

-3 

. V 2 = 

r 

9 i 

， V 3 = 

"1 

11 


_ 7 



1 

6 


H = Span { v ,, v 2 , v 3 } 可以证明 4 vi + 5 v 2 -3 v 3 = 0 , 
利用这个信息求好的一个基，答案不惟一. 



'T 


' 4" 


1" 


20. 令 v ,= 

4 

-9 

, v 2 = 

—7 

2 

， v 3 = 

-5 

3 

，可以证明 


-5 


. 5_ 


.4 



v , -3 v 2 + 5 v 3 = 0 ,利用此信息求 W = Span ( vi , v 2 , 


v 3 } 的一个基. 


在习题21和习题22中，标出每个命题的真假， 
给出理由. 

21. a . 单独一个向量是线性相关的. 

b . gZ / sSpanfA ,，...,*,} ,则汍,...木}是好的 
一个基. 


c . 一个 nxn 可逆矩阵的列构成 R ” 的一个基. 

d . 基是一个尽可能大的生成集. 

e . 在某些情形，矩阵列之间的线性相关关系受 
某种初等行变换的影响. 

22. a . 子空间//中一个线性无关集是//的一个基. 

b . 若非零向量的一个有限集合 S 生成一个向 
量空间 V ，则 S 的某子集是 V 的一个基. 

c . 基是一个尽可能大的线性无关集. 


d . 4.2 节中描述的对 NulA 产生一个生成集的 
标准方法，有时对产生 NulA 的基不起作用. 

e . 若 S 是矩阵 A 的阶梯形，则 S 的主元列构成 
Col A 的一个基. 


23. 设 R ^ Span ^,...,。} ，解释为什么 { v , ，…， v 4 } 
是 R 4 的一个基. 


24. 令石 ㈠ 〜…乂}是 R " 中的一个线性无关集，解 
释为什么 { v ,, ...，》>„}是 IT 的一个基. 


r 


O ' 


o " 


0 

M 

, V 2 = 

Li 


[oj 

， 令好是 R 3 


中第二和第三个数字相同的向量的集合，由于 


s 


r 


0" 


0 

}] 

=s 

0 

i 

+( 卜 w 

t ] 

+ s 

1 

0 


对任意 s 和 f 均成 


立，则//中每个向量有由 Vbhh 线性组合而 
成的惟一的一个表达式，问 { VbV ^ Vs } 是好的 
基吗？为什么是或为什么不是？ 

26. 在所有实函数的向量空间中，求由丨 S i nf ， s in 2 f , 
siiucosf } 生成的子空间的一个基. 

27. 令 V 是刻画物体-弹簧系统振动的函数的向量 
空间，（参考 4.1 节中习题19)，求 V 的一个基. 

28. (RLC 电路）下图中的电路由一个电阻器 [/? 欧 
姆]、一个感应器 [ L 亨]、一个电容器 [ C 法拉] 
和一个初始电压源组成 . ^b = RI 、2 L ) ，同时假 
设/?， L , C 已经选好使得也等于1/ VI ?.(这 
是可以做到的，比如，在一个伏特计中使用该 
电路时 .） 令 v ( f ) 表示时间 f 时的电压 （ 伏特)， 
它由电容器的两端测得.可以证明 v 在将 v ( f ) 
映到 Lv{t) + Rv\t) + (HC)v(t) 的线性变换的零 


空间好中，好由所有形如 v ( f ) = e - t , ( c 1 + c 2 t ) 的 
函数构成，求好的一个基. 
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习题 29-30 表明 R " 中每一个基一定恰好由《 
个向量构成. 

29. 令是 IT 中 fc 个向量的集合， 
it < n ，利用 1.4 节中的一个定理解释为什么 S 
不能是 IT 的一个基. 

30. 令 ■? = {»>,, 是 IT 中 it 个向量的集合， 
k>n ,利用第1章中的一个定理解释为什么 
S 不能是 IT 的一个基. 

习题31和习题32表明线性无关和线性变换之 
间的一个重要联系，同时提供了使用线性相关定义 
的练习，令 V 和 W 是向量空间，令是一 
个线性变换，且令 { v , ，…, vd 是 V 的一个子集. 

31. 证明： 若在 V 中是线性相关的，则其 
像集{打〜),…,；^%)}在 W 中也是线性相关的. 
这个事实表明如果一个线性变换将集 
< v ,, …， v p } 映射成线性无关集{7>,)，… , r ( v p )} , 
则原来的集合也是线性无关的.（因为它不能 


是线性相关的 .） 

32. 假设 r 是一个一一的变换，使得方程 r («) = r ( v ) 
总是蕴涵 《 = v , 证明： 如果像集 
{ r ( v ,),...， r (» v )} 是线性相关的，则 v p } 也 
线性相关.这个事实表明一个一对一的线性 
变换将线性无关集映射到一个线性无关集. 
(因为在此种情形下，像集合不能是线性相关 
的 .） 

33. 考虑多项式 /»,( f ) = l + f 2 , /» 2 ( f ) = l - f 2 , {/ 

是巧中的线性无关集吗？为什么？ 

34. 考虑多项式 p ,( f ) = l + f , p 2 (0 = l - t , p 3 ( t ) = 2 

练习 题答案 


(对所有的 f ), 检査开，/ ，仍 之间的线性相 
关关系，然后求 Spanfp , ，/> 2 ，/> 3 }的一个基. 
35. 设 V 是一个包含向量集{«1,« 2 ，《3，《 4 }的向量空 
间，说明如何构造 V 中的一个向量集 
{ vi , V 2, v 3 , v 4 } 使得 {*>,,*>3} 是 SpanfvhVhVhVt } 的 
一组基. 


36. [\1]设 H =Span{« 1 ，《 2 ，》 3 } ,K =Span{vi,v 2 ,v 3 } , 
其中 



求尺和好+尺的基.（参见 4.1 节的习题33 


和习题 34.) 

37. [ M ] 证明： { f , siiu , cos 2 f ， sinfcosf } 是定义在 R 上 
的函数集合的一个线性无关集，开始先假设 


c , - t + c 2 sinf + c 3 - cos It + c 4 sinfcosf = 0 ( 5 ) 
方程 （ 5 ) 对所有实数 f 一定均成立，选几个特 
殊的 f 值 （ 比如 f = 0,0.1,0.2 ) 直到得到足够的 
方程构成的方程组以便确定 所有& 一定为零. 
38. [ M ] 证明： { l ， cosf ， cos 2 f ，...， cos 6 f } 是定义在 R 上 
的函数集合的一个线性无关集，利用33题中 
的方法.（此结果在 4.5 节中的习题34中用到 .） 


1. ^A = [ v , v 2 ], 行变换表明 



1 -2" 


■1-2* 


-2 7 

- 

0 3 

j 

3 -9 


0 0 


A 中的行并不是每一个都含有一个主元位置，由 1.4 节中的定理4, A 的列不能生成 R 3 ,从而 { Vl ， v 2 } 不 


是 R 3 的一个基.又由于不在 R 2 中，它们不可能是 R 2 的一个基.然而，由于显然是线性 
无关的，它们是 R 3 的子空间 Span { v „ v 2 } 的一个基. 
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2. 构造矩阵 A ， 它的列空间由 { v ,, v 2 ， v 3 ， v 4 } 生成，然后行化简 A 从而找到它的主元列. 


1 6 2 -A 


"1 6 2-4" 


■16 2 4 

-3 2-2-8: 


0 20 4 -20 


0 5 1-5 

4-13 9」 

1 

—0-25-5 25」 

1 

0 0 0 0_ 


A 的前两列是主元列，从而构成 Col A = VV 的一个基，从而 { v ,， v 2 } 是 W 的一个基. 

注意： 为了确定主元列，不需要将 A 化成简化阶梯形. 

3. v , 和 V ,均不在《中，所以 { w ,} 不能是《的一个基.事实上，{^ 2 }是所有形如 （£ ^ 2 ,0)的向量构成 
的平面的一个基，而《仅仅是一条直线. 

4.4 坐标系 

对一个向量空间 V ,明确指定一个基 e 的一个重要原因是在 v 上强加一个‘‘坐标系，，.本 
节我们将证明如果 S 包含 n 个向量，则坐标系将使 V 像 R " —样便于 操作. 若 V 就是 K ” 本身， 
则打将确定一个坐标系，它给 V 以一个新的“视野”. ’ 

坐标系的存在依靠下列基本结果. 

定理7 (惟一表示定理） 

令打=汍，…， 1} 是向量空间 V 的一个基，则对 V 中每个向量 J ， 存在惟一的一组数 Cl ，…， Cn 
使得 ’ ’ ° 

x =C 1^1 + + ( 1 ) 
证由于 S 生成 V ， 则存在一组数 Cl ，…， 使得 （ 1 ) 式成立，假设 JC 还有其他表示： 

X = dib x + ■■■ + d„b„ 

山，…， d „ 为数 ，则二式相减有 

( 2 ) 

由于 S 是线性无关的， （ 2冲的权一定为零，即 Cy . = dj M 1< J < n 均成立. _ 

定义假设集合5 = {私，…， A „} 是 V 的一个基， jc 在 V 中， jc 相对于基5的坐标（或 jc 的 B - 
坐标 ）是使得 x = +..，+ c „ A „ 的权 . 

若 C ,， …，£?„是；《：的坐标，则 K " 中的向量 

Ci 

[ x] B =:' 

[c n _ 

是 X (相对于 5) 的坐标向量，或 X 的5-坐标向量，映射 JCHOi 称为（由5确定的）坐标 
映射 . 0 


© 在坐标 映射的 概念中 假定基 S 是-组有编号的向量集，其向量以-个预先指定的次序排列.这个性质使得[以的 
定义没有二义性. 
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例1考虑 R 2 的一个基3 = {也， M ， 这里私=|^^ 2 =匕],假设 K 2 中一向量 a ： 具有坐标向 
*[jc] b =^J, >%x. 

解 x 的坐标揭示如何由打中的向量求 I, 即 1 = (-2) 卜 +3匕=(-2)|^| + 3|^| = |^.国 
例 2 向量: c=l^j 中的数字是 jc 相对于标准基€ = 由于 

[l] = 1 (o] + 6 (i] = 1 ' Cl+6 - C2 


若 f = {e,，e 2 }， 则 [x] f 


坐标的几何意义 

一 个集合上的坐标系由此集合中点到 K" 中的一一映射 组成. 例如，当我们选取垂直的轴同 
时在每个轴上取一个相同的度量单位时，通常的图纸给出了平面上的一个坐 标系. 图 4-15 展示 

了标准基{«,，《 2 }，例 1 中的向量 &(=«,) 和匕以 及向量坐标 1 和 6 给出 jc 相对于标准基 

的 位置： 在 e, 方向上有1个单位，在《 2 方向上有6个单位. 

图 4-16 展示来自图 4-15 的向量私, 卜和; c. (从几何意义上看，这三个向量在这两个图中 
均位于一条垂线上 .） 然而，标准坐标的格子被去掉同时被特别适合例1中的坐标 S 的格子所取 

代.坐标向量 [JC] B =^j 给出 jc 在新的坐标系中的位置：在私方向上有 -2 个单位，在^方向上 

有3个单位. 


图 4-15 标准图纸 



例3在结晶学中，晶体格的刻画可由选取 K 3 中的一个基 {«，v，w} 而得到帮助，这个基对 
应着晶体的单位方格的三个相邻的棱，一个完整的格子框架可以通过将许多个单位方格的复制 
品堆积在一起而构造.有14种类型的单位方格，图 4-17 中展示了其中的3种 . 3 


(巧参见 The Science and Engineering of Materials,4th Ed” Donald R.Askeland (Boston:Prindle, Weber & Schmidt, 2002), 
p.36. 
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a) 主体居中的立方晶格 b) 表面居中的正交晶格 c) 简单的单斜晶格 

图 4-17 单位方格的例子 


「1/2 _ 

相对于晶体格的基，可以给出晶体中原子的坐标.例如 1/2 标识图 4 -17 b 中最上面的中心 

_ 1 J 

原子. _ 

中的坐标 


当 IT 中的一组基 S 固定时，容易求出任一指定的向量 jc 的坐标，如下面例子所示. 
例4令 ⑵， S = ,求出 jc 相对于 S 的坐标向量 [ jc ] s . 

解 JC 的坐标 Cl , c 2 满足 



^ [l (3) 

办 1 *2 X 

这个方程可以通过在一增广矩阵上做行变换或利用左边矩阵的逆解出.不论哪种解法，其 
解均为 c , =3， c 2 =2 ， 从而 jc = 3*,+2 A 2 ， 同时有 


见图 4-18. 




图 4-18 x 的 S - 坐标向量为 （3,2) 


■ 
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(3) 式中的矩阵将向量X的 S- 坐标变为 Jt 的标准坐标.对 R" 中的一个基 S = 汍， …太}， 
可以施行类似的坐标变换.令 

jPb =[*1 办 2… 办 》] 

则向量方程 

x = C\bx +c 2 b 2 + -"+c„b m 

等价于 



我们称 ft 为从 S 到 R” 中标准基的坐标变换矩阵.通过左乘巧将坐标向量 [x] B 变换到X • 
坐标变换方程 （ 4 ) 是重要的，它将在第5章和第7章的多个地方用到. 

由于作的列构成 K" 的一个基， 片是可 逆的（由可逆矩阵定 理）. 通过左乘 ft— 1 又将 jt 变回 
坐标 向量： 

Pb ， JC = [ x] b 

这里由 ft— 1 产生的映射是前面提到的坐标映射.因为/V 1 是一可逆矩阵，由可逆矩 
阵定理 （ 也可参见 1.9 节定理12 ), 此坐标映射是一个由 R" 到 R” 上的一一线性变换.我们将会 
看到，坐标映射的这个性质对具有一个基的一般的向量空间也成立. 

坐标映射 

对向量空间V选定一个基5 =汍，… A}, 它引出V中一个坐标系.坐标映射； ci ~>[ jc ] b 将可 
能不熟悉的空间V与熟悉的空间 K" 联系了起来，见图 4-19. V中的点现在可以由它们的新“名 
字”来确定. 



图 4-19 由 V 映上到 IR ” 的坐标映射 


定理8令 S = { 私,是向量空间 V 的一个基，则坐标映射—个由 V 映上到 
R" 的一对一的线性变换. 

证取V中两个典型的向量，比如 

u = cA+-+cJb n 
w=dA+-+d„b n 

利用向量运算， 


于是 


u+w = {c l +d l )b,+ -+(c„+d^. 
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[« + w] B : 



C,+rf,' 


Cl 


'd ； 


=1 


= 


+ 


= 

1 

C„ +d„_ 


_^n 


_d n 



: [«] B + [w] B 


从而坐标映射保持加法封闭.若 r 是任一数，则 

ru = r(Cib' + • • • + c„*„) = (re, )*, + … + (rc„)A„ 

于是 


\-ru] B = 

rc x 

： 

- 

Ci 


rc n 


■ C n 


从而坐标映射也保持标量乘法 封闭. 于是坐标映射是一个线性变换.坐标映射是一对一的 
以及它将 V 映上到 R " 的证明分别留作习题23和 24. ■ 

正如 1.8 节那样，坐标映射的线性性可推广到线性组合.若 Kl ，…，心在 V 中， c ，… c 是数 
则 ’ w ’ 

[ c ,«, + …+ 化] 8 = c 1 [«, l y + … + ( 5 ) 

换句话说， （5) 说明 I /,，...，〜的一个线性组合的谷―坐标向量等于它们坐标向量的相同的线 
性组合. 

定理8中的坐标映射是一个由 V 到] r 上同构的重要例子一般而言，从一个向量空间^映 
上到另一个向量空间灰的 一一 巧性变换称为从 1 /和灰上的一个同构 ( isomorphism ). (在希 
腊语中 iso 表示相同， morph 表示形状或结构 .） 1/和灰的记号和术语可能不同’但这两个空间 
作为向量空间则不加以 区分. 每一个在 V 中的向量空间的计算可以完全相同地出现在灰中反 
之亦然.见习题25和习题 26. ’ 

例5令5是多项式空间 P 3 的标 准基； 即5 = {1，以 2 4 3 }，炉 3 中的一个典型元素 /> 具有形式： 
P(0 = a 0 +a x t + a2t 2 

因 p 已经给出了标准基向量的一个线性组合，我们断定 


«0 


_ 1:1 

一于是坐标映射 P 4 [ pL 是一个 P 3 到 R 4 上的 同构. P 3 中所有向量空间运算都对应着]^中的 

运算. _ 

如果我们考虑将巧和 R 4 分别展现在两个计算机的显示器上’两个显示器由坐标变换相联 
系，则一士显示器中巧的每一个向量空间的运算被正确地复制到另一个显示器中 R 4 的一个对 
应的向量运算.巧显示器上的向量看起来与 R 4 显示器上的向量不同，但它们作为向量的“作用” 
是完全相同的，见图 4-20. 
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图 4-20 空间 P , 与 R 4 同构 


例6利用坐标向量证明在 P 2 中多项式 l + 2^ 2 ,4+ f +5 f 2 ,3+2 r 是线性相关的• 

解 由例5中的坐标映射可分别产生出坐标向量 （ 1，0,2 )， （ 4,1,5 ), ( 3,2,0 ). 将这些向量 
写成一个矩阵 A 的列，可以通过行化简 Ac = 0 的增广矩阵来断定它们的线性相 关性： 


14 3 0' 


1 4 3 0' 

0 12 0 


0 12 0 

2 5 0 0 


0 0 0 0 


A 的列是线性相关的.所以对应的多项式也是线性相关的.事实上，容易检査 A 的第3列 
是2倍的第2列减去5倍的第1列.多项式的对应关系是 

3+2 r = 2(4+ r +5 f 2 )-5( l +2/ 2 ) ■ 

最后一个例子是关于 R 3 中一个与 R 2 同构的平面. 

例7令 v , = ,B = [ v l , v 2 ] ，则的一个基.判定 x 是 


否在 W 中，若在，求*相对于 e 的坐标向量. 

解若 JT 在//中，则下列向量方程是相 容的： 



'3 


- l ' 


* 3' 

Cx 

6 

+ c 2 

0 

= 

12 


2 


1 


7 


数 C ,, C 2 若存在的话，它们就是*的坐标.利用行变换，得到 


■3-1 3' 


1 0 2 

6 0 12 


0 1 3 

2 1 7 


0 0 0 


T * c ,=2, c 2 =3,[ x ] b = ^ ,由 0 确定的//上的坐标系如图 4-21 所示. 
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图 4-21 R 3 中平面上的坐标系 


若//选一个不同的基，相应的坐标系也使 W 与 R 2 同构吗？这一定是正确的，下节中我们 
将证明这一结论. 

练习题 


令私 = 

V 

0 

，办 2 = 

[t 

，办3 = 

_ 3_ 

-<5 

，x = 

2 


0 


°, 


3 


3 


a . 证明集合6 =汍太，仏}是1^的一个基. 

b . 求由 S 到标准基的坐标变换矩阵. 

c . 写出 K 3 中 * 与[太:^相关联的方程. 

d . 对上面给出的 *, 求 [ jc ] b . 

2. 集合5 = {1+/,1+/ 2 ,*+/ 2 }是1? 2 的一个基.求 pW = 6+3»- r 2 关于 B 的坐标向量. 
习题 4.4 


在习题 1-4 中 . 已知基 B 和坐标向量 [:c] B , 
求向量 *. 


1. B = | 

-5 

’[tl 卜 . 


2. B = | 

[:} 

7 6 !， 


[J] 


3. B = | 

1 

-A 

3 

2 

-2 

" 4" 

，- 7 

0 

卜 ] B = 

' 3. 

0 

- 1 

4. B = | 

_r 

2 

0 

' 3' 

-5 

2 

.4 
，- 7 

3 

卜 ] B = 

8 

r 7 


在习题 5-8 中，求 X 关于给定基 B = 
的坐标向量 [: c] B . 


-3 

M = 

' 2 

-5 

- 

[1 


r 

•- 2 

jh= 

-6 

- 

::] 


r 


-3 


•2 


' 8* 

-i 

2 = 

4 

fb,= 

-2 

,x = 

-9 

-3 


9 


4 


6 


Jh = 

2 

1 


1 

-1 

.x = 

' 3 

-5 


8 


2 


4 


在习题 9-10 中，求由 S 到 R ” 中标准基的坐 
标变换矩阵 . 
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" 3' 

* 2" 

" 8] 

10. B =- 

-1 

0 

-2 


4 

-5_ 

7」 


在习题11 〜 12中，对给出的 X 和 B ， 利用逆 
矩阵求 [ xL . 


12 叫邮 H 3 


13. 集6 = {1 + ! 2 ，! + 广1 + 2/ + ? 2 }是1 1 2 的一个基，求 
pW = l + 4 r + 7 f 关于 B 的坐标向量. 

14. 集 B = { l -~-， 2 ,2-2，+， 2 }* P 2 的一个基， 
求 p ( f ) = 3 + f -6 f 2 关于 B 的坐标向量. 

在习题15和习题16中，标出每个命题的真假， 

验证每个答案.除非另外说明， B 均指向量空间 V 
的一个基. 

15. a . 若; t 在 V 中且 B 包含 n 个向量，则 JC 的 B - 

坐标向量在 IT 中. 

b . 若 ft 是坐标变换矩阵，则 W s = /^，； teV . 

c . 向量空间1? 3 和]8 3 是同构的. 

16. a . 若 B 是 R " 的标准基，则 R " 中 x 的坐标 

向量是 * 本身. 

b . 对应 l>] s 称为坐标映射. 

c . 在某种情形下， R 3 中的平面可以与 R 2 同 
构. 


[400 獻 2 但不 
法将表为 


17. 向量 v , 

构成一个基，用两种不同的方 


Vi,v 2 ,v 3 的线性组合. 

18. 令6 = {私，…入}是向量空间 V 的一个基，解释 
为什么私,… A 的 B - 坐标向量是 nxn 单位矩 
阵的列〜..々. 

19. 令 S 是向量空间 V 中的有限集，具有如下性 
质： V 中每个 JC 均可表示为 S 中元素的惟一线 


性组合，证明 S 是 V 的一 个基. 

20. 假设 { vwd 是向量空间 V 的一个线性相关 
生成集，证明 V 中每一个 w 都可用多于一种 
的方式表示成 v ,， …， v 4 的线性 组合. （提 示： 
令 w = Jt , v ,+ … + Jt 4 v 4 是 V 中一任意向量，利用 
{ v lt -, v 4 } 的线性相关性将 w 表示为 V ,，…, v 4 
的另一个线性组合 .） 

21. 令 B = 因为由 B 确定的坐标映射 

是一个从 R 2 映射到 R 2 的线性变换，此映射一 
定可由某 2 x 2 矩阵 A 来实现，求出 A . (提 
示：由 A 去乘可使向量; t 变换到它的坐标向量 
W B .) 

22. 令6 =队."人}是 R ” 的一个基，作出一个 
nxn 矩阵 A 的描述，它使得坐标映射 
: ch »[； c ] s 得以实现.（见习题 21.) 

习题 23-26 涉及一个向量空间 V ，一个基 

B = {匕…人}和坐标映射 ; t Dt] s . 

23. 证明坐标映射是一一的.（提 示： 假设对 V 中 
某向量《和 w ，满足 [«] s =[ w] B ,证明 u = w .) 

24. 证明坐标映射是映上到 R " 的，即任给 R " 中向 
量> ,具有元素 y u -,yn , 存在 V 中的向量《， 
使得 [«] s =>. 

25. 证明 V 中子集{«,，…， 《 p } 是线性无关的，当且 
仅当坐标向量在 R " 中也是线 
性无关的. 提示： 因为坐标映射是一一的，下 
列方程具有相同的解 Cl ，…， Cp . 

c t u , + ■■■ + c p u l> = 0 V 中的零向量 

[ c,« I + - + c ;) « ; ,] B =[0 ] B R " 中的零向量 

26. 给定 V 中向量 «,,•••,«, 和 w ，证明 w 是 

《 p 的线性组合，当且仅当 [ w ] s 是坐标向 
量 [«, k …, [«； J S 的线性组合 • 

在习题 27-30 中，利用坐标向量检验多项式集 

合的线性无关性. 
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27. 1 +， 3 ,3 + /-2/ 2 ，-，+ 3/ 2 -/ 3 

28. l -2 t 2 -3 t\t + t\l + 3 t -2 t 2 

29. ( r - l ) V -2，( f -2) 3 

30. (卜，) 3 ，(2- 3 W -4, 3 

31. 利用坐标向量检验下面的多项式集合是否生 
成 P 2 , 验证你的结论. 

a . l -3 t + 5 t \-3 + 5 t - lt \-4 + 5 t -6 t \ l - t 2 

b . 5 t + t \\- St -2 t \-3 + 4 t + 2 t \2-3 t 

32. 设 p , ⑴ = 1 +， 2 ， p 2 ( t ) = 2 -t + 3 t 2 , p 3 (0 = l + 
2 t -4 t 2 . 

a . 利用坐标向量说明这些多项式集合是1? 2 
的一组基. 

b . 考虑 P 2 的一组基6 = {/>, ， p 2 ， p 3 } ,给定 

-3' 

[?] B = 1 ,求趴中的？. 

2 _ 

在习题33~34中，利用坐标向量检验下面的多 
项式集合是否构成 P 3 的一组基，验证你的结论. 

33. [M] 3 + 7 f ,5 + f-2f 3 ,f-2f 2 ,l + 16 ； -6r 2 + 2； 3 

34. [ M ] 5-3 t + 4 t 2 +2 t \9 + t + St 2 -6 t \6-2 t + 5 t 2 , t 2 

35. [M] 令 = Span{v 1 ,v 2 },B = {v„v 2 }, 证明; t 在// 
中并求; t 的 B - 坐标向量，其中 


"11' 


'14" 


'19' 

>0 

yV 2 = 

-8 

y X = 

-13 

13 


18 



W 


15 


36. 1^]令尺 sSpanlVhWjhBHvw], 证明 B 
是 W 的一个基并且 * 在中，再求; t 的 B - 
坐标向量，这里 


练习题答案 



-6" 


' 8" 


-9" 


■4 


4 


-3 


5 


7 

Vi = 

—9 

， v 2 = 

7 

， v 3 = 

-8 

yX = 

-8 


L 4 」 


—3 」 


L3j 


_ 3 


[M] 习题37和习题38涉及钛的晶体格，它具 


有六边形结构，见图 4-22 左图， R 3 中向量 


^ 2.6' 

"o' 

'0 

-1.5 

3 

0 

0 

0_ 

4.8 


对展示在右图中的单位方格构成 


一组基，这里的数字是以埃 （ 1埃 = 1(^ 厘米）为 
单位的，在钛合金中，一些添加的原子可能在“八 
面体的”和“四面体的”位置的单位方格内.（这 
样命名是由于这些位置的原子所形成的几何对 
象 .） 


rfrl 



图 4-22 六边形的封装晶格和它的单位方格 


' 1 / 2 " 

37. 相对于格的基，八面体中一位置为1/4 

.1/6」 

对于 K 3 的标准基，确定这个位置的坐标. 


38. 四面体中一个点的位置为相对于 R 3 的 
标准基，确定这个位置的坐标. 


l . a . 矩阵尸 s =[ ft , 匕匕]行等价于单位矩阵是明显的，由可逆矩阵定理，巧是可逆的，同时它的列构成 R 3 
的一个基. 

1-3 3 

b . 由 U ) ■知，坐标变换矩阵为尸 0 4-6. 

0 0 3 







向量空间 


225 


C. JCt/UjcL. 

d. 为解 （C)， 行化简增广矩阵而不计算 iV 1 可能更容易一些. 


■1-3 

3 

-8" 


"10 0 -5" 

0 4 

-6 

2 


0 10 2 

0 0 

3 

3_ 


0 0 1 1 

Pb 


X 


I 


■-5_ 

从而 W«= 2 

1 

2. p(/) = 6 + 3f — / 2 相对于 B 的坐标满足 Ml + O + QU + O + cW + AsG + Sf-f 2 ，对比 r 的同次幂项的系数 
有 

Ci + c 2 =6 
Cl +C 3 = 3 
c 2 +c 3 =-l 
' 5" 

解之，得 A =5，c 2 =l，c 3 =_2 ，从而 [p]jt= 1 . 

-2 


4.5 向量空间的维数 


回顾前面，一向量空间V 的基若含有 n 个向量，则V与 IT 同构，本节我们证明数 n 是V 
的一个内在的性质（称为维数），它不依赖基的选择，维数的讨论将对基的性质有更深人的理解. 
第一个定理推广关于向量空间 K" 的一个著名的结果. 


定理9 若向量空间 V 具有一组基 0 =你, ••.,&}，则 V 中任意包含多于 n 个向量的集合一 
定线性相关. 


证令 { Ul ，...， Up } 是 v 中一个含有多于《个向量的集合，因为坐标向量 [ Ul ] s ，…， [« P L 个数 
(P) 大于每个向量中数字的个数（《)，所以 [ Ul L，...，[« P L 线性相关.于是存在数量 Cl , …，&不全 
为0,使得 


Cl[«l]s + … + C P [« P L =: 

0 


R" 中的零向量 


因为坐标映射是线性变换 


[c,«i+--- + c p « p ] s =: 

0 
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于是 C|M| + … + <^11, = O.Ai + … + 0- ft « = 0 , 因为 Ci 不全为零，所以 {U|, 是线性相关的 . e ■ 

由定理 9 可推出如果一向童空间 V 有一组 II 个向量的基，则 V 的每组基必定是由 /I 个向量 
所组成. 

定理10若向量空间 V 有一组基含有 n 个向量，则 V 的每一组基一定恰好含有个向量. 
证 令 技 是一个含/ I 个向童的基，枉是 V 的任一另外的基，因为 谷 是一个基， ft 是线性 
无关的，则由定理 9, ft 不能含有多于《个向量，同理由 枉是一 个基，线性无关，氏至少含 
有 n 个向量，于是 ft 恰好含有 n 个向童. ■ 


如果一个非零向董空间 V 由有限集 S 生成，则由生成集定理， S 的一个子集是 V 的一个基. 
由此，定理10保证下列定义有意义. 


定义若 V 由一个有限集生成，則 V 称为有限维的， V 的维数写成 dimV ， 是 V 的基中含 
有向量的个数，零向量空间 {0} 的维数定义为零.如果 V 不是由一有限集生成，则 V 称为无穷维 
的 ■ 


例1 K " 的标准基含有 n 个向量，所以 dimR " = / I ,标准的多项式基 } 表明 dimP 2 = 3 , 
般 而言， dimP ^ rn + l , 所有多项式的空间 P 是无穷维的（见习题 27). ■ 


例2 4 W = Span { v ,, v 2 } ,这里 


y 

6 

, v 2 = 

-r 

0 

,则 W 是 

2 


1 



4.4 节的例7中研究过的平面， H 的一个基为这是由于 


»>,和 v 2 不是倍数关系从而线性无关，于是 dim H = 2 . 
例 3 求下列子空间的 维数： 

[ a -3 b +6 c ~\ 

5a+4d 
b-2c-d 
5d 

解 易见《为下列向量的所有线性组合的 集合: 


■ 


H 


： c,f>,c,deR 




1 


-3. 


6 


O ' 


5 


0 


0 


4 

Vi = 

0 

，卩2 = 

1 

, v 3 = 

-2 

， v 4 = 

— 1 


0 


0 


0 


5 


显然 v |5 t 0. v 2 不是 V ,的倍数，但 h 是 h 的倍数，由生成集定理，去掉 h 仍可生成《.最后 
由于 v 4 不是 V ,和 v 2 的线性组合，所以 { v „ v 2 , v 4 } 是线性无关的（由 4.3 节中定理4 ), 进而是《的 


© 定理9也可应用到 V 的无限集中.一个无限集称为线性相关的，如果其中某一有限集是线性相关的.否则这个无 
限集是线性无关的.若 S 是 V 中一个无限集，任取 S 的子集 （《, ....， u r \, p>n . 上面的证明表明这个子集是线性相 
关的，从而 S 也是线性相关的. 
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一个基，于是 dim « = 3. ■ 

例4 R 3 的子空间可用维数分类，见图 4-23. 

0维子空间.只有零子空间是0维子空间. 

1维子空间_任一由单一非零向量生成的子空间，这样的子空间是经过原点的直线 • 

2维子空间.任一个由两个线性无关向量生成的子空间，这样的子空间是通过原点的平面 • 
3维子空间.只有 R 3 本身是3维子空间_由可逆矩阵定理， R 3 中任意3个线性无关向量生 
成整个 R 3 . 




图 4-23 R 3 的子空间样本 


有限维空间的子空间 

下一个定理是生成集定理的一个自然配对. 

定理11 令好是有限维向量空间 V 的子空间，若有需要的话， W 中任一个线性无关集均 
可以扩充成为 W 的一个基， W 也是有限维的并且 

dimff <dimV 

证若《 = {0},必然有 dimW = ( KdimV . 否则，令5 = {叫，.-.，吣}是 W 中任一线性无关集， 
若 S 生成//，则打是 S 的一个基.否则，存在//中某向量 14 +| 不在 SpanS 中，但{«,，…， Kil , ii t+1 } 
将会是线性无关的，这是因为此集中没有一个向量可以表示为其前面向量的线性组合（由定理 
4). 

只要这个新集合不能生成《，我们就可以继续这个扩充 S 到 H 中一个更大的线性无关集的 
过程，但由定理9， S 的线性无关扩充中向量的个数永远不能超过 V 的维数，所以 S 的扩充最 
终会生成《而且将成为《的一个基，同时 dim «< dimV . ■ 

当一个线性空间或子空间的维数知道后，通过下一个定理，求一个基就简单了.即如果一 
个集合有适当个数的元素，则我们仅需要证明或者这个集合是线性无关的或者它生成这个空间. 
这个定理在许多应用问题（例如包括微分方程和差分方程）均具有非常重要的意义，这里线性 
无关性比生成性更容易验证. 

定理12 (基定理） 

令 V 是一个 p 维向量空间， p ^ l , v 中任意含有个元素的线性无关集必然是 V 的一个基. 
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任意含有 p 个元素且生成 V 的集合必然是 V 的一个基. 

证 由定理11，含 p 个元素的线性无关集 S 可以扩充为 V 的一 个基. 但由于 dimV = P ， 基 
必须恰好包含 P 个向量，所以 S 已经是 V 的一个基.现假设 S 含有 p 个向量且生成 V ，因为 V 是 
非零的，生成集定理蕴涵 S 的一个子集 S ' 是 V 的一个基，因为 dimV = p ， S ' —定包含个向量， 
从而 S = S '_ ■ 

Nul / A 和 Col / A 的维数 

由于矩阵 A 的主元列构成 Col A 的一个基，我们一旦知道主元列，就知道了 Col A 的维数 • 
对 Nul A 的维数似乎需要做更多的工作，因为求 Nul A 的一个基通常比求 Col A 的一个基需要更 
多的时间，但有一条捷径可走！ 

令 A 为一个矩阵，假设方程 Ac = 0 有 fc 个自由变量 •由 4.2 节，我们知道求 NulA 的生 
成集的标准方法将恰好产生个线性无关向量，比如说是《,，•__，《*，每一个向量对应一个自由变 
量.所以 { m ,, …，叫}是 NulA 的一个基，自由变量的个数决定基的 大小. 为了后面的参考，让我们 
总结一下这些事实. 

| NulA 的维数是方程 Ac = 0 中自由变量的个数， ColA 的维数是 A 中主元列的个数. ~~| 

例5求 A 的零空间和列空间的维数. 

"-3 6 -1 1 -1 

A = 1 -2 2 3 -1 

_ 2 -4 5 8 ^ 

解 将增广矩阵 [A 0] 行化简成阶梯形得 

"1 -2 2 3 -1 0" 

0 0 12-20 
0 0 0 0 0 0 

有3个自由变量一 x 2 ，; c 4 和； c 5 , 于是 NulA 的维数是3,由于 A 有两个主元列，所以 
dim Col A -2. ■ 

练习题 

判定下列每个命题的真假，对每个答案给出理由.这里 V 是一非零有限维向量空间. 

1. 若 dimV = p ， S 是 V 的一个线性相关的子集，则 S 包含多于 p 个向量. 

2. 若 S 生成 V , 7■是 V 的一个子集且含有向量个数多于 S 中向量个数，则7■是线性相关的. 


习题 4.5 

对习题 1~8 中的子空间， （ a) 求一个基， （ b) 说出 
维数. 


's-2i 

I [ 

■4〆 

s + t 

： ^,reR[ 2 - 

-3^ 

3t 

1 1 

-t 


2c 



a + 2b 


a,fc,ceR} 



:a,b,ceM> 
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a-4b-2c 

2a + 5b- 4c 

-a + 2c 

_3cz + 7Z? + 6c 

: a,b,c 6 R 

3a + 6b — c 

6a-2b- 2c 

-9a + 5b + 3c 

: a,b,c e R 

-3a + b + c 



7. { {a y b,c) : a - 2b + c = 0,b - 2c = 0,2b - c = 0} 


8. [(a y b,c,d) : a-3b + c = 0] 

9. 求 IR 3 中所有第一个和第 三个数 字相等的全体 
向量生成的子空间的维数. 

10 . 求此 2 中*[_;]， ㈡ ， [1] 生成的子空间 
H 的维数. 


在习题11和习题12中，求已给向量生成的子 


空间的维数. 


11 . 


12 . 


0 

2 


4 

-2 


-3 


1] 「-3"| r-8l ["-3" 
-2 ， 4 ， 6 ， 0 

0 15 7 


确定习题13~18中给出矩阵的 Nul A 和 Col A 
的维数. 


13. 



-6 9 0 -2" 

12-45 
0 0 5 1 

0 0 0 0 


14. A = 


0 0 
0 0 
0 0 


1 _3 
0 1 
0 0 


-1 6 
7 0 

4 -3 
0 0 


在习题19和习题20中， V 是一个向量空间， 

标出每个命题的真假，给出理由. 

19. a . 矩阵的主元列的个数等于列空间的维数. 

b . R 3 中的平面是 R 3 的2维子空间. 

c . 向量空间恥的维数为 4. 

d . 若是 V 中一个线性无关集，则 S 
是 V 的一个基. 

e . 若集合 { v ,，...， v p } 生成一个有限维向量空间 
v , r 是 v 中多于户个向量的集合，则 r 是 
线性相关的. 

20. a . R 2 是 R 3 的一个2维子空间. 

b . 方程 At = 0中变元个数等于 Nul A 的维数. 

c . 一个向量空间是无穷维的，如果它由一个无 
限集生成. 

d . 若 dimV = n ，* S 生成 V ，则 S 是 V 的一个基. 

e . R 3 只有一个3维子空间即 R 3 本身. 

21. 前4个埃尔米特 （Hermite ) 多项式为 
l 2 t -2 + 4 t 2 和 -12 r + 8 r 3 , 这些多项式是在研 
究数学物理中的某种重要的微分方程时产生 
的戶证明这前4个埃尔米特多项式构成吧 3 的 
一个基. 

22. 前4个拉盖尔 （ Laguerre ) 多项式为 1,1- r , 
2-4 r + r 2 和 6-18 r +9 r 2 - r 3 . 证明这些多项式 
构成 P , 的一个基. 

23. 令5是1» 3 的一个基，它由21题中埃尔米特多 
项式组成，令 pW = 7-12 r -8 r 2 +12 r 3 ,求 p 相 
对于6的坐标向量. 

24. 令6是1> 2 的一个基，它由22题中前3个拉盖 
尔多项式组成，令 p ( r ) = 7-8 r + 3 r 2 ,求 p 相对 
于6的坐标向量. 

25. 令 S 是 n 维向量空间 V 的一个子集，设 S 包含 



0 

-1 O ' 


"1 4 -1' 

\ 1 .A = 

0 

4 7 

18. A = 

0 7 0 


0 

0 5_ 


0 0 0 


0 参见 Functional Analysis, 2d ed.， 

A.E. Taylor and David C. Lay (New York: John 
Wiley & Sons, 1980), pp. 92-93. 此书还讨论了其 
他多项式. 
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少于 n 个向量，解释为什么 S 不能生成 V . 

26. 令//是/!维向量空间 V 的一个 n 维子空间，证 
明 《= V . 

27. 解 释为什么所有多项式的空间 P 是一个无穷 
维空间. 

28. 证明定义在实数直线上的全体连续函数的空 
间 C ( IR ) 是一个无穷维空间. 

在习题29和习题30中， V 是一个非零有限维 
向量空间，列出的向量在 V 中，标出每个命题的真 
假，给出理由 .（ 这些问题比习题19和习题20难 
些 .） 

29. a . 若存在集合 { v ,，..., v p } 生成 V ，则 dimV 彡 p . 
b . 若 V 中存在一个线性无关集 { v ,，〜， v p } ，则 

dimV ^ p . 

C. 若 dimV = p, 则 V 中存在一个 p + 1 个向量 
的生成集. 

30. a . 若 V 中存在一线性 相关集{ V ,，…， v p } ，则 

dimV ^ p . 

b . 若 V 中任意由 p 个元素组成的集合均不能 
生成 V ，则 dimV > p . 

c . 若 p >2 ,dimV = p ，则每个由 p -1 个向量构 
成的集合是线性无关的. 

在习题31和习题32中，涉及有限维向量空间 
v 和 w , 还有线性变换 

31. 令//是 v 的非零子空间， r (//) 为//中向量的 
像集，则由 4.2 节中习题35, r ( H ) 是 W 的子 
空间.证明 dim . 

32. 令//是 V 的非零子空间，7■是一个由 V 到 W 
内的—— （ 线性）映射，证明 dimr (//) = dim //. 

练习 题答案 


若 T 是一个由 V 到 W 上的一一映射，则 dimV 
= dimW . 同构的有限维向量空间具有相同的 
维数. 

33. [ M ] 按照定理11， 1 T 中一线性无关集 
{»>,，...，》>»}可以扩充为 K " 的一个基.一个方法 
是构造矩阵 4=[ Vi … Vi e r .. e „]， 其中 e , ，…, e „ 
是单位矩阵的列，那么4的主元列构成 R " 的 
一个基. 

a . 利用这个方法将下列向量扩充为 R 5 的一 
个基. 


-9" 


" 9" 


* 6' 

-7 


4 


7 

8 

， v 2 = 

1 

， v 3 = 

-8 

-5 


6 


5 

_ 7_ 

1 

-7 


- 1 _ 


b . 解释下列 问题： 为什么原来的向量 v ,, …, 
包含在 CoM 的基中？为什么 CoM = IT ? 

34. [ M ] 令 B = { l , cosr , cos 1 2 cos 6 /},C = { l , cosr , 

cos 2 r , -, cos 6 r }, 假设有下列三角恒等式（见 
4.1 节习题37 ): 
cos 2 r = -l + 2 cos 2 r 
cos 3 r = -3 cosr + 4 cos 3 1 
cos 4 r = 1 - 8 cos 2 r + 8 cos 4 r 
cos 5 r = 5 cosr - 20 cos 3 r + 16 cos 5 r 
cos 6 t = -l + 18 cos 2 /- 48 cos 4 r + 32 cos 6 t 
令 H 为 6 中函数生成的子空间，则由 4.3 节中 
习题38，6是//的一个基. 

a . 写出 C 中向量的6-坐标向量，利用它们证 
明 C 在 H 中是线性无关集. 

b . 解释为什么 C 是//的一个基. 


1. 错，考虑集合 {0}. 

2. 对，由生成集定理， S 包含 V 的一个基，称这个基为疒.从而 r 包含比疒更多的向量，由定理9, r 是 

线性相关的. 
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4.6 秩 

由向量空间概念的帮助，本节我们观察矩阵的内部，揭示几个有趣且有用的隐藏在行和列 
之中的关系. 

例如，设想在一个 40 x 50 矩阵 A 中放置2 000个随机数，然后确定 A 中线性无关列的最大 
个数和 A T 中线性无关列的最大个数（即 A 中线性无关行的最大个 数）. 值得注意的是，这两个 
数是相同的，我们将要看到，这个公共值是矩阵 A 的秩。为了解释这个现象，需要检查由 A 的 
行生成的子空间. 

行空间 

若 A 是一个 mxn 矩阵， A 的每一行具有 n 个数字，即可以视为 IT 中一个 向量. 其行向量的 
所有线性组合的集合称为 A 的行空间，记为 Row A . 由于每一行具有 n 个数，所以 Row A 是 R " 
的一个子空间.因为 A 的行与 A T 的列相同，我们也可用 Col A T 代替 Row A _ 

例1令 

"-2 -5 8 0 -17] r , = (-2,-5, 8, 0,-17) 

_ 1 3-5 1 5 r 2 =( l ,3,-5, l ,5) 

A= 3 11 -19 7 1 r 3 =(3,11,-19,7,1) 

—1 7 -13 5 -3 J r 4 =(1,7,-13,5,-3) 

A 的行空间是 R 5 的子空间，它由生成.即 Row AsSpanh ,/^，，/^) ，将行向量横 
着写是很自然的，然而，有时为了方便，它们也可以写成列 向量. ■ 

在例1中，如果我们知道一些关于 A 的行之间的线性相关关系，那么我们可以利用生成集 
定理将这个生成集缩小到一个基.不幸的是，在 A 上进行行变换对我们没有帮助，因为行变换 
改变了行的相关关系.但行化简 A 当然是有价值的，正如下一个定理展示的那样！ 

定理 13若两个矩阵 A 和 B 行等价，则它们的行空间相同.若 B 是阶梯形矩阵，则 B 的 
非零行构成 A 的行空间的一个基同时也是 B 的行空间的一个基. 

证若 B 是由 A 进行行变换得到的，则 B 的行是 A 的行的线性组合，于是 B 的行的任意 
线性组合自然是 A 的行的线性组合.从而 B 的行空间包含于 A 的行空间，因为行变换可逆，同 
理知 A 的行空间是 B 的行空间的子集，从而这两个空间相同.若 B 是一个阶梯形，则其非零行 
是线性无关的，这是因为任何一个非零行均不为它下面的非零行的线性组合，于是 B 的非零行 
构成 S 的行空间的一个基，当然也是 A 的行空间的一个基. ■ 

本节的主要结论涉及三个 空间： RowA ， ColA * NulA ， 下面的例子为这个结论做准备，同 
时展示如何通过对 A 进行的一系列行变换得到三个空间的基. 

例2分别求矩阵 A 的行空间、列空间和零空间的基. 
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-—2 -5 8 0 -17 

13-51 5 

3 11 -19 7 1 

1 7 -13 5 -3 

解为了求行空间和列空间的基，行化简 A 成阶 梯形： 
~ 3-515 


A-B- 


0 1 
0 0 
0 0 


由定理13， B 的前3行构成 A 的行空间的一个基（也是 B 的行空间的基），从而 
Row A 的基： {(1，3，一5，1，5)，(0，1，—2,2，-7)，(0,0,0,4,20)} 

对列空间，观察 fi ， 主元列在第1，2和4列，从而 A 的第1，2和4列（不是 B 的）构成 Col A 
的一个基. 


-2' 

'-5' 

01 

1 

3 

1 

3 

11 

7 

1 

7 

5 J 


Col A 的基: 


注意到 A 的任何阶梯形提供（在它的非零行 ） Row A 的一个基同时对 ColA 确定了 A 的主元列. 
然而对 NulA ， 则需要简化阶梯形，则 B 进一步行变 换得： 

10 10 r 

0 1-20 3 

0 0 0 1 -5 

0 0 0 0 0 


A-B-C= 


方程如 = 0等价于 Cx = 0， 即 


x 2 - 2 jc 3 + 3 jc 5 = 0 
jc 4 — 5 jc 5 = 0 

所以々 =- x 3 - x 5 , x 2 = 2 Xi - 3 x 5 , x 4 = 5 x 5 , 和々为自由变量，通常的计算（在 4.2 节中讨论过） 表明: 



-f 

2 


-1] 

-3 

NulA 的 基：. 

1 


0 


0 


5 


0 


lj 


通过观察可见，与 ColA 的基不同 ， Row A 和 Nul A 的基与 A 中的数没有简单的联系戶 


O 利用 A 的行求行空间 Row A 的基是可以办到的，对 A T 进行行化简，直到 A T 的主元列被求出，这些主元列是 A 的 
行，它们构成 A 的行空间的一个基. 
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警告 在例 2 中，尽管 fi 的前 3 行是线性无关的，但由此推断说 A 的前 3 行是线性无 
关则是错误的（事实上 A 的第 3 行等于 2 倍的第 1 行加上 7 倍的第 2 行），行变换对 
矩阵的行不保持线性相关关系. 

秩定理 

下一定理描述 Col A ， Row A 和 Nul A 的维数之间的基本关系- 
定义 A 的秩即 A 的列空间的维数. 

由于 Row 4与 Col A t 相同，则 A 的行空间的维数等于 A T 的秩.零空间的维数有时被称为 A 
的 零维， 尽管我们不使用这个术语. 

做过 4.5 节的习题或读完上面的例2后，瞥觉的读者可能已经发现下一个定理的部分或全 
部结论. 

定理14 (秩定理） 

wx /! 矩阵 A 的列空间和行空间的维数相等，这个公共的维数 （ 即 A 的秩）还等于 A 的主元 
位置的个数且满足方程 

rank A + dimNul A = n 

证由 4.3 节定理6 ， rank A 是 A 中主元列的个数，等价地 ， rank A 是 A 的阶梯形 B 中主 
元位置的个数.进一步，因为 B 对每个主元有一个非零行，同时这些行对 A 的行空间而言构成 
一个基，所以 A 的秩也等于 A 的行空间的维数. 

由 4.5 节， NulA 的维数等于方程如=0中自由变量的个数，换句话说， NulA 的维数是 A 
中非主元列的个数，显然有 

{ 主元列个数 }+{ 非主元列个数 }={ 列的个数} 

这就完成了測 . " 

定理14后面的思想在例2中的计算中可以看到.阶梯形 B 的三个主元位置确定了基本变量 
同时确定了 Col A 和 Row A 的基向量. 

例3 a . 若 A 是一个 7 x 9 矩阵，具有2维零空间， A 的秩是多少？ 
b . 一个 6 x 9 矩阵能有2维零空间吗？ 

解 a . 由 A 有9列， （ rankA ) + 2 = 9, 从而 rankA = 7. 

b . 不能，若为一个 6 x 9 矩阵’具有2维零空间，它的秩一定等于 7( 由秩定理），但 B 的 
列是 K 6 中向量，从而 Col fi 的维数不能超过6,即 rank B 不能超过6_ ■ 

下一个例子为我们一直在研究的子空间直观化提供了一个好的方法，在第6章中，我们将 
学习到 Row A 和 NulA 的公共向量只有零向量，并且事实上二者是相互“垂直”的，对 
1^4 7 (=0)14和灿14 7 有同样的结果.所以例 4 中的图 4 -2 4 对一般情形建立了一个良好的理 
解图像. （ A T 和 A 在一起研究的价值见习题29中 .） 
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'3 0 -1 

例4令/!= 3 0-1，容易检验 NulA 是 jc 2 轴， RowM 是平面， ColA 是方程为 
.4 0 5 

义 i - A =0 的 平面. NulA T 是所有(1，-1，0)的倍数构成的集合.图 4-24 展示出在线性变换 xh At 
的定义域中的 NuM 和 Row /1; 这个映射的值域 ColA 连同 Nul / T —起，被表现为 R 3 的一个分 
离的拷贝. 



图 4-24 由矩阵 A 确定的子空间 _ 

应用到方程组 

秩定理对线性方程组的信息进行处理是一个有力的工具.下一个例子模拟一个利用线性方 
程的现实问题，可能前面陈述过，例中没有直接用到线性代数的术语如矩阵、子空间、维数等 
例5 —个科学家对一个40个方程42个变量的齐次方程组已经求出了两个解，这两个解 
不是倍数关系，而且其他所有解均能表示为这两个解的适当倍数之和 • 这个科学家能确定一个 
相应的非齐次方程组 （ 与此齐次方程组有相同的系数）有 解吗？ 

解 有解， 令 A 是这个方程组的 40 x 42 系数矩阵，已给的条件蕴涵这两个解是线性无关的 
且能生成 NuM ， 所以 dimNulA = 2. 由秩定理， dimCol>l = 42 - 2 = 40. 由于 R 40 是 R 40 的惟一 
的维数是40的子空间，则 Col A —定等于 R «’ 这表明每个非齐次方程如 = ft 有一 个解. ■ 
秩和可逆矩阵定理 

与矩阵相关的各种线性空间的概念对可逆矩阵定理提供了更多的一些命题，这里我们仅列 
出新的命题，但我们把它们接在 2.3 节中原来的可逆矩阵定理的后面. 

定理（可逆矩阵定理（续 ）） 

令 4是一个矩阵，则下列的命題中的每个均等价于 A 是可逆矩阵； 

m . / I 的列构成 R ” 的一个基. 

n . Co\A = R \ 

o . dimColi ^ = « . 

p . rank A = n . 

q . NuM = {0}. 

r . dimNuM = 0. 
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证命题 （m ) 从线性无关和生成的角度看，与命题 （e ) 和 （h ) 是逻辑上等价的.至于 
上面其他五个命题，可由下列常见的蕴涵关系将它们与这个定理早期的一个命题链接 起来： 


( g )=>( n ) =>( o ) =>( p ) =>( r ) =>( q ) =>( d ) 

命题 （ g ) 称对 M " 中的每个 ft , 方程 如=办至 少有一个解，由此可以推出 （ n ), 因为 CdA 
实际上就是使方程 Ac = 6相容的所有6的集合.蕴涵式 ( n )=>( o )^( p ) 由维数和秩的定义可以推 
出.如果4的秩等于/«，即4的列的个数，则由秩定理有 dimNuM = 0 ,也就是 Nul 4 = {0}. 于 
是 ( p ) =>( r ) =>( q ). 而且由 ( q ) 可以推出方程 Ac = 0 只有平凡解，即命题 ( d ). 因为已经知道命题 ( d ) 
和 ( g ) 与4是可逆的命题是等价的，于是定理证毕. ■ 

我们没有将关于4的行空间的显然的命题添加到可逆矩阵定理中，这是因为行空间是的 
列空间.回顾可逆矩阵定理的 （ 1 ) 即4可逆当且仅当可逆，从而可逆矩阵定理的每个命题 
也适合 4 t ， 这样做将定理的长度加倍，从而产生一串超过30个的命题！ 

数值计算 的注解 本课程中讨论的许多算法对理解概念和进行简单的手工运算是有 
用的.然而，这些算法通常不适合大规模的现实 问题. 

秩的确定是一个很好的 例子. 将矩阵简化为阶梯形然后再数主元个数似乎很容 
易，但是除非在一个数字被明确指定的矩阵上执行精确的算法，否则行变换可能改变 

一个矩阵表面上的秩.比如，若矩阵 D =中的 x 值没有被当作7精确地存储在计算 

机中，那么秩可能是1或2，这依赖于计算机是否将; c -7 当作零处理. 

在实际应用中，矩阵4的有效秩常由4的奇异值分解来确定，这将在 7.4 节中讨 
论. 通过这种分解还可以可靠地求出 CoU , Row A , Nul /1 和 Nul/T 的基. 

练习题 

下列矩阵是行等价的. 


' 2 -1 

1 

-6 

8 


■1 

-2 

-4 

3 

-2 

1 -2 

-4 

3 

-2 

B = 

0 

3 

9 

-12 

12 

-7 8 

10 

3 

-10 


0 

0 

0 

0 

0 

4 -5 

-7 

0 

4」 


0 

0 

0 

0 

0 


1. 求 rank A 和 dimNul A . 

2. 求 Col A 和 Row /!的基. 

3. 如果想要求 Nul 4 的一个基，下一步要做什么？ 

4. 的行阶梯形中有多少个主元列 v 

习题 4.6 


在习题1~4中，假设 A 行等价于 B ， 不用计 
算， 写出 rank A 和 dimNul A ，再求 Col A ， Row A , 

1. A = 

1 -4 

-1 2 

9 

-4 

-7" 

1 

，B = 

"l 0 

0-2 

-1 5' 

5 -6 

NulA 的基. 


5-6 

10 

7」 


0 0 

0 0 
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-3 4-1 9" 

6 - 6-1 -10 
9 -6 -6 -3 

-9 4 9 0 


B= 0 
0 


-3 0 5 -1 

0 2-38 
0 0 0 5 

0 0 0 0 


3. A = 


' 2 -3 6 2 5" 

-2 3 - 3-3 4 

4-6959 
-2 3 3 41 


B = 


*2 -3 6 2 5" 

0 0 3 -1 1 

0 0 0 1 3 

—0 0 0 0 0 - 

1 1 -3 7 9 -9" 

1 2 ^ 10 13 -12 


4. A = \l -1 -1 


1-3 1-5-7 3 

1 一 2 0 0 -5 -4 


"1 1 -3 7 9 -9' 

0 1-13 4-3 

B = 0 0 0 1 -1 -2 

0 0 0 0 0 0 

0 0 0 0 0 0 


5. 若一个 3 x 8 矩阵 /! 秩为 3 ，求 dimNulA ， 
dim Row A fP rank A T . 

6. 若一个 6 x 3 矩阵秩为 3 ，求 dimNulA ， 
dim Row <4 和 rank A T . 

7. 假设 4 x 7 矩阵 /! 有 4 个主元列 ， Col A = R 4 吗？ 
Nul/l = R 3 吗？解释你的答案. 


8. 假设 5 x 6 矩阵 A 有4个主元列， dimNulA 是多 


少？ ColA = R 4 吗？解释你的答案. 

9. 若 5 x 6 矩阵 A 的零空间是4维的， A 的列空间 
的维数是多少？ 

10. 若 7 x 6 矩阵 A 的零空间是5维的， A 的列空间 
的维数是多少？ 

11. 若 8 x 5 矩阵4的零空间是2维的，4的行空间 


的维数是多少？ 

12. 若 5 x 6 矩阵4的零空间是4维的，4的行空间 
的维数是多少？ 

13. 若4是 7 x 5 矩阵，4的秩最大可能为多少？若 
4是 5 x 7 矩阵，4的秩最大可能为多少？解释 
你的回答. 

14. 若4是 4 x 3 矩阵，4的行空间的维数最大可能 
为多少？如果/!是 3 x 4 矩阵，4的行空间的维 
数最大可能为多少？解释你的回答. 

15. 若4为一个 6 x 8 矩阵， Nul/l 的最小可能的维 
数是多少？ 

16. 若 A 是一个 6 x 4 矩阵， NulA 的最小可能的维 
数是多少？ 

在17和18题中，4是一个矩阵，标出 
每个命题的真假，检验每个答案. 

17. a . 4的行空间与的列空间相同 • 

b . 若 fl 是4的任一个阶梯形， fl 有3个非零 
行，则 A 的前3行构成 Row A 的一个基. 

c . 矩阵4的行空间与列空间具有相同的维数， 
甚至4不是方阵，此结论也成立. 

d . /!的行空间的维数与零空间的维数之和等 
于4的行数 • 

e . 在计算机上，行变换可能改变一个矩阵的表 
面上的秩. 

18. a . 若 fl 是4的任一阶梯形，则 fl 的主元列构成 

4的列空间的一个基. 

b . 行变换保持4的行之间的线性相关关系. 

c . 4的零空间维数等于4的非主元列个数. 

d . ，的行空间与4的列空间相同. 

e . 若4与 fl 行等价，则它们的行空间相同. 

19. 假设一个含有5个线性方程6个未知数的齐次 
方程组的解都是一个非零解的倍数，对方程右 
边每个可能选取的常数，此方程组将必然会有 
一个解吗？解释之. 

20. 假设一个含有6个线性方程8个未知数的非齐 
次方程组有一个解，具有两个自由变量，若改 
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变方程右边某常数，使新的方程组不相容可能 30. 假设4是 mxn 矩阵， A 在 R " 中，为使方程 
吗？解释之. Ar = A 相容，关于两个数 rank [A A ] 和 rank A 


21. 假设一个含有 9 个线性方程10个未知数的非 
齐次方程组对右边所有可能的常数均有解，相 
应的齐次方程组可以找到两个不成倍数的解 
吗？讨论之. 

22. 个 含有10个方程12个未知数的齐次方程组 
的所有解为 '个确定的非零解的倍数，这个结 
论可能吗？讨论之. 


一定有什么关系？ 

秩为1的矩阵在某些计算以及本书的几处上 
下文的理论处理中都是重要的，其中包括第7章中 
的奇异值分解.可以证明 mxn 矩阵4的秩为1当 
且仅当它是一个外积，即对某 《 enr, 某 venr, 
有 /1 = IIV T . 习题31~33暗示为什么这个性质是正确 
的. 


23. - 个含有12个线性方程8个未知数的齐次方 
程组有两个固定的没有倍数关系的解，同时所 
有其他解均是此二解的线性组合，所有解的集 
合可以由少于12个齐次线性方程的方程组刻 
両吗？若可以，有多少个方程？讨论之. 

24. —个含有7个方程6个未知数的非齐次方程 
组，对右边某些常数，该方程组有惟一解可能 
吗？对右边任一组常数，该方程组有惟一解可 
能吗？解释之. 

25. '个科学家解一个含有10个线性方程12个未 
知数的非齐次方程组，发现未知数中有3个是 
自由变量，该科学家是否可断定，若方程右边 
改变，新的非齐次方程组将有一个解‘？讨论之. 

26. 在统计理论中，通常需要一个矩阵是满秩的， 
即矩阵的秩取到最大，对一个 mx „ 矩阵，其 
中行数大于列数，解释为什么该矩阵满秩当且 
仅当它的列是线性无关的. 

在习题 27 ~ 29 中，涉及一个 mxn 矩阵/!和通 
常被称为由 A 确定的基本子空间. 

27. Row /!， CoM ， NuM ， Row / T,Col / 1 T 和 Nul A T 
中哪-个子空间在 nr 中，哪一个在 r " 中？ 其 
中有多少不同的子空间？ 

28. 验证以下 等式： 

a . dim Row A + dim NuM = « A 的列数 

b . dim Col A + dim Nul A J =m A 的行数 

29 . 利用 28 题解释为什么方程； = 6 对任意 
fteffT 有解当且仅当方程 ， x = 0 仅有平凡解. 



— 2— 


a 

31. 验证：如果11 = 

- 3 

，v = 

b 




c 


32. 令 a 


' I ]， 求 


K 3 中向量 V ， 使得 



= « v T . 


33. 令 A 为任意一个 rankA = l 的 2 x 3 矩阵，令《为 
4的第一列，且《*0,解释为什么存在一个 
R 3 中的向量 v 使得 /l = « v T . 若4的第一列为 
零，这个结论如何修改？ 


34. 令4为一个秩为的 mxn 矩阵，令{/为 A 的 
一个阶梯形，解释为何存在一个可逆矩阵£使 
得 4 = 利用这个因子分解将4写成 r 个 

秩为1的矩阵之和.（提示 ：参考 2.4 节定理 
10 .) 


35. [\1]令 A = 


'1-9 -4 5 3 -3 -7_ 

-4 6 7 -2 -6 -5 5 

5 -7 -6 5 -6 2 8 

-3 5 8 -1 -7 4 8 

.6 -8 -5 4 4 9 3」 


a . 构造矩阵 C 和它们的列分別为 Col 4和 
N U 14 的基，再构造矩阵/?,它的行构成 


Row 4 的一个基. 


b . 构造矩阵 A / ，它的列构成 Nul 的一个基， 
构造矩阵 ■ SM/fT W]，J = [C M ] ,解释为 
什么 s 和 r 应为方阵，验证 S 和 r 均为可逆 
的. 


36. [ M ] 随机取一个 6 X 7 整数值矩阵并且它的 
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秩最大为4,重复习题35,生成4的一个方法 
是： 随机建立一个 6x4 整数值矩阵_/和一个 
4x7 整数值矩阵&，令4 = 从 .（ 见本章后面 
的补充习题9;阅读学习指导中关于矩阵生成 
程序的说明 .） 

37. [M] 令4是35题中的矩阵，构造一个矩阵 C， 

使它的列是4的主元列，再构造一个矩阵/?， 

练习题答案 

1. A 有两个主元列，所以 rank/l = 2, 又由于 A 共有5列，所以 dimNuM = 5-2 = 3 . 

2. A 的主元列是前两列，所以 Col4 的一个基为 



B 的非零行构成 Row /I 的一个基，即 {(1 ， -2 ，气 3,-2),(0,3,9,-12,12)} ， 在此特殊例子中， 4 的任意两行 
构成行空间的一个基’这是因为行空间是2维的，同时4中任一行均不是另一行的倍数.一般面言， 
A 的阶梯形的非零行通常可作为 Row A 的一个基， A 本身的行则不行. 

3. 对 Nul/l， 下一步是对 fl 进行行变换得到4的简化阶梯形. 

4. 由秩定理，因 Col A T = Row A， 所以 rank A T = rank A ， 从而 A T 有两个主元位置. 

4.7 基的变换 

对一个”维向量空间 V ，当一个基 B 取定后，与之相关的映射到 R " 上的坐标映射对 V 提供 
了一个坐标系 . V 中每个向量 jc 由它的坐标向量匕] 5 惟一确定 0 

在某些应用中，一个问题开始是用一个基6描述，但问题的解可通过将 B 变为一个新的基 
C 得到帮助 （ 例子将在第 5 章和第 7 章中给出）.每个向量被确定为一个新的坐标向量.在 
本节中，我们研究对每个 JC 6 V , [^] (: 与[^] 5 如何联系起来. 

为使问题直^化，考虑图 4-25 中的两个坐标系，在图 4-25a 中， x =3 b t + b 2 , 同时在图 4-25b 
中，同样的 jc 表示为1=6^+4«2,即 



我们的问题是找到这两个坐标向量之间的联系，例1表明如何作这件事，使我们知道如何 
由 c , 和 c 2 得到 ft , 和 . 


使它的行是4的简化阶梯形的非零行， 计算 
Of 并讨论你得到的结果. 

38. [M] 对三个随机取的 5x 7 整数值矩阵秩分 
别为5, 4和3,重复37题.对任意矩阵作 
关于 C/f 与4有何关系的一个猜想，证明你的 
猜想. 


G) 将 [ j ：] s 看作 f 的一个“名字' 它给出权的列表将; c 表示为 g 中基向量的线性组合. 




图 4*25 同样向量空间的两个坐标系 


例1对一个向量空间 V ，考虑两个基 5 = { U 2 } 和 C = { c ,， c 2 }， 满足 
b\ — 4^1 +C 2 办 2 = ■- +C 2 

假设 jc = 36, +i 2 


解对 （2) 中 jr 应用由 C 确定的坐标映射，因为坐标映射是一个线性变换. 

[ x] c = [3*, + b 2 ] c 
= 3[bi]c +[^ 2 ]^ 

利用将线性组合中的向量看做矩阵的列，我们可以将这个向量方程写成一个矩阵 方程： 
Wc=[[*,]c [* J C ] [jj (3 

只要我们知道该矩阵的列，这个公式就给出了 [ jc ] c ， 由（1)， 


于是 （3) 给出 了解: 


= [l 4 ] ’[tl 

«H:] 


即与阁 4-25 中 jc 相匹配的 jt 的 C - 坐标. 

可以将推导出公式 （3) 的论证推广从而产生下列结果 .（ 见习题15和习题 16.) 


得 


定理15设 B = { 私，… A}*C = { c ,， 是向量空间 V 的基，则存在一个 nxn 耗阵/>使 

C*-B 

Wc = (4) 

e &的列是基中向量的 C - 坐标向量，即 " 

尸 =[[* i]c [匕!：… [ ftJc ] (5) 
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定理15中矩阵/>称为由 S 到 C 的坐标变换矩阵.乘以的运算将坐标变为 C - 坐标， 0 

C*-B C*-B 

图 4-26 给出坐标变换方程 （ 4 ) 的说明. 

V 

x 

_^ 

w ' 乘以 P 灿 

c*s 

R ' R - 

图 4-26 V 的两个坐标系 

/>的列是线性无关的，这是因为它们是线性无关集5的坐标向量（见 4.4 节习题 25), 于 

Ci-B 

是得到是可逆的.将 （4) 两边左乘以得 

( pJ ' Wc = W b 

于是是将 C - 坐标变为坐标的矩阵，即 

UT ' 己 (6) 

R " 中基的变换 

若 5 = {*,，•“，*„}， f 是 R 1 •中的 标准基 {cd PJ [*,],=*,. B 中其他向量也类似.在此 
情形下，=.&与 4.4 节中引人的坐标变换矩阵 ft 相同，即 
ft =[A| & … A„] 

为了在 R " 中两个非标准基之间变换坐标，我们需要定理15,定理15表明为解决基变换问 
题，我们需要原来的基关于新的基的坐标向量. 

例2设办, =^ j , c , = 1』， C2 = j ^ j ， 考虑 ® 2 中基谷={办1，办2}， CyCbtrj }, 求由 B 
到 C 的坐标变换矩阵. 

解矩阵上涉及私和办 2 的 C - 坐标向量，设[私] 0] c =|^， 于是由定义 

[Ci c 2 ]^'j=i, [c, c 2 ] P* j = * 2 

© 为了记住如何构造这个矩阵.将 ^^[1^ 看作 e &的列的线性组合，这个 矩阵一 向量积是一个 C- 坐标向量，所以 
c P B 的列也应该是 C- 坐标向 M. 
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为了同步解出这两个方程组，将私和 匕扩大 到系数矩阵中并行化 简之： 


[Cl C 2 I b\ 办 2 ] = I 


6 4 

-5 -3 


(7) 


::4 [叫 


于是 [ b 2 \ : 

因此所要求的坐标变换矩阵是 

‘=■ [ 从 ] =[j _;] ' 

观察例2中的矩阵 P ,它已经出现在 （7) 中，这并不会令人感到意外，因为 P 的第 

C*-B c*-B 

列是行化简 [ c , c 2 丨私]到 [/i [6丄]的结果，对/ s 的第2列也是类似的，于是 
[ci c 2 : A 2 ]~[/ 

求 R " 中的任意两个基之间的坐标变换矩阵具有类似的步骤. 

例3设 ^ J , c , =|^ ^ j , c 2 = ^j , 考 ftR 2 中的基 S = { 也 ，办 2 }，C = { c ,, c 2 }. 

a . 求由 C 到 S 的坐标变换矩阵. 

b . 求由 S 到 C 的坐标变换矩阵. 

解 a . 注意到求 P 比求 P 更方便，计算 


lb, b 2 


c 2 ] = 


1 -2 
-3 4 


-5] 「1 0 

7 J ~1_0 1 


5 3 

6 4 


所以 


P = 


9 

5 3 1 

.6 4 j 

b ■由 （ a ) 和上面的 （5) 式（将 S 和 C 互换） 

P 十)、 i[ 4 - 3 1J 2 - 3/2 l ■ 

C—S 2 |__6 5 」 L — 3 5/2 J 

另一个关于坐标变换矩阵的描述，是使用坐标变换矩阵 P s 和 P c 分别将坐标和 C - 坐 
标转换成为标准坐标.回忆对 R " 中的每个 x ,有 

PbVx] b = x, P c [x\=x, [x\= P c ~'x 

于是 

[x] c = P c - l x = P c -'P B [x] B 

在 IT 中，坐标变换矩阵可以用/^户 8 来计算.事实上，对于比 2 x 2 更大的矩阵，一个 
类似于例3的算法比先计算巧- 1 再计算的方法更快，见 2.2 节习题 12. 

练习题 

1. 设7 = {/,，/ 2 }4 = {奶，* 2 }为向量空间1的两个基，/>为一个矩阵，它的列是[/,兀和[/ 2 兀，对所有 
满足下列哪一个 方程？ 
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⑴ [vLr = Ptv] e (ii) [v] e = P[v]jr 

2. 设 6 和 C 如例 1 所示，利用例1的结果求由 C 到6的坐标变换矩阵. 


习题 4.7 

1. 设 5 = {ft, 丸}和 C = { Cl , C2 l 是向量空间V的两个 
基，设 

b ,=6 c : - 2 c 2 , b 2 =9c, ~4 c 2 
a. 求由 6 到 C 的坐标变换矩阵. 
b_ 利用 (a), 对; c =-3^ + 2^ ,求 [: c] c . 

2. 设 S = {A,，A 2 } 和 C = { C| ，c 2 } 是向量空间V的两个 
基，设 

bi = - c , +4 c 2 , b 2 =5c, -3 c 2 

a. 求由 6 到 C 的坐标变换矩阵. 

b. 对; c = 5屯 + 36 2 ,求 [;c] c • 

3. 设 和 W = { h >,， h > 2 } 是 V 的两个基， P 
为一个矩阵，它的列为[味；^.和 [ aL . 对所有 
xeV, P 满足以下哪一个 方程？ 

(')[*]« = P [ x] w (ii) [x] w = P [ x] u 

4. 设 _4 = { fl ,,fl 2 ，fl 3 } 和 V = { d u d 2 , d } ) 是 V 的两个 

基，尸 = [ [d，X<[d 2 L[d 3 ]_4] ，对所有 满足 

以下哪一个方程？ 

(i)[xL = P [ x ] t ， (ii)[x] P = P[ x ]^ 

5. 设和 6 = {Hft 3 } 是向量空间 v 
的两个基，设〜：你-匕， a 2 =- b t + b 2 + b 3 , 
a 3 = b 2 - 2 b 3 . 

a. 求由 >4 到 5 的坐标变换矩阵. 

b. 对:^知丨+—+〜，求 [x] 5 . 

6. 设 © = {^6} 和，={/,，/ 2 ，/ 3 }是向量空间 v 
的两个基，设/| = 2rfi-d 2 +d 3 ， / 2 = 3 d 2 + d } , 
f } =-3 d ,+2 d ,. 

a. 求由 7 到 2? 的坐标变换矩阵. 

b. 对 a : = /,-2/ 2 +2/ 3 , 求 W d . 

在习题7〜10中，设6 = {屯太}和 C = { Cl ， C2 } 是 
1R 2 的两个基，求由6到 C 的坐标变换矩阵和由 c 
到 B 的坐标变换矩阵. 


7 . H 7 } ft 2= Kh = [」]’ c2= [tl 
8 - 番41 

9 孙 2= 0’ C1 得 2= f -3 

10 . ft i = [4〜=[H ㈤ 

在习题 11 和习题 12 中，6和 C 是向量空间 V 
的两个基，标出每个命题的真假，给出理由. 

11. a . 坐标变换矩阵的列是 C 中向 量的; B - 坐 

标向量. 

b . 計=『， C 为 V 的标准基，则乙与 4.4 

节中引人的坐标变换矩阵 ft 相同. 

12. a . 的列是线性无关的. 

b . 若 K = R 2 ,B = { ft „ ft 2 } fq C = { c „ c 2 } ,则将 
[A c 2 ft , ft 2 ] 行化简为 [/ P ] 时产生一矩阵 
P’ 满足对任意 : cev, 均有 [: c] s = p[ ； c] c . 

13. 在]? 2 中，求由基 6 = { l -2 f + f 2 ,3-5 f + 4 f 2 ,2 f + 
3 f 2 } 到标准基 C = { UP } 的坐标变换矩阵，再 
求 -1 + 2/ 的6-坐标向量. 

14. 在1? 2 中，求由基 6 = { l -3 f 2 ,2 + f -5 f 2 ,l + 2 f } 到 
标准基的坐标变换矩阵，再将^写成 S 中多项 
式的线性组合. 

在习题15和习题16中，通过填写正确的理由 
完成定理15的证明. 

15. 给定 veV ， 则对某些数; c ,， …，;^有 

v = x l b ] + x 2 b 2 - h -" + x n b n 

这是因为 （ a ) ,应用由基 C 确定的坐标 
映射，有 

[v] c = x x [bi ] c +X2lb 1 \c + ••• + x„[b„] c 
这是因为 （ b ) ,由定义 ( c ) ,我们 
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可以将这个方程写成以下 形式： 

a 

[v] c = [[ 办 ■[ 办 2 ]c … \~b n ] c ] : (8) 

_ X n _ 

因为 （8) 式右边的向量是 （d ) ，这就证 
明了对于 (5) 中的矩阵上满足 
[v] c =A[v] s . 

16. 设 G 是任意矩阵，使得 

[ v ] c =G[ v] b 对 vev (9) 
在 （ 9 ) 中，设 v =ft, ，则 （ 9 ) 表明 0J C 是 G 
的第一列，因 为⑻ . 类似地，对 fc=2, …， 
n,<2 的第 fc 列是 (b ) ，因为 （c ) . 这 
表明由定理15中的 （5) 定义的矩阵 P 是满 

Ct-B 

足条件 （4) 的惟一矩阵. 

17. [M]® B = { x 0 ,---, x 6 },C = {^ o .---,^6) , 这里心 
是函数 cos'h 是函数 cosfcf , 4.5 节习题34 
证明6和 C 都是向量空间 H =Span{x 0 ,---,x 6 } 
的基. 

a. 设/> = [[外 ] B … [_y 6 ] s ] ,计算 P— 1 . 

b. 解释为什么厂 1 的列是;(。，...，* 6 的0-坐标 
向量，然后利用这些坐标向量写出表示 C 
中函数 cos/ 的幂的三角恒等式. 

18. [M]( 需要微积分的知识） 0 回顾微积分中如下 
积分： 

练习题答案 


J (5 cos 3 /-6 cos 4 f + 5 cos 5 /-12 cos 6 f)df ( 10) 
其计算过程是繁琐的_ ( 通常的方法是重复利 
用分部积分法和半角公式 .） 使用17题的矩阵 
P 或厂 1 变换 （8) 式，再计算这个积分. 



■ 1 2 -1' 


[-21 

-8' 

19. [ M]SP = 

-3-5 0 

,Vi = 

2 , v 2 = 

5 


4 6 1 



2_ 


V3 tT 

a . 求 M 3 中的一个基 { ha } ，使得 P 是由基 

到 { v „ v 2> v 3 } 的坐标变换矩阵. 
(提示：么的列 代表什么？） 

b . 求 1 R 3 的一个基 { h ^ h ^ h ^}， 使得 P 是由基 
{ VbV 2 , V 3 } 到基的坐标变换矩阵. 

20.设6 = [ b u b,),C = { Ci , c 2 ),V = { d u d 2 } 是一个2维 
向量空间的3个基. 

a . 写出一个将和联系起来的方 
程，验证你的结果. 

b . [ M ] 针对 1 R 2 中的3个基（见7~10题），利 
用一个矩阵程序帮你找到这个方程或者检 
验你写出的方程. 


1. 由于 P 的列是 g - 坐标向量，形如办的向量一定是 g - 坐标向量，从而 P 满足方程 （ ii ). 

2. 例1中求得的坐标向量表明 

，，祕[砧]=口 

从而 

/ >=(/>r=4 1 6 1 J ai a6 l 

Wb} 10[_ - 1 4」 L~0_1 0.4」 


0 习题 17 和习题 18 以及前几节中的 5 个相关习题的思想来自 Auburn 大学 Jack W.Rogers, Jr. 写的一篇文章，此文 
章于1995年8月在国际线性代数协会的会议上宣读，见 “Applications of Linear Algebra in Calculus ” ， American 
Mathematical Monthly 104(1), 1997. 
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4.8 差分方程中的应用 

现在，功能强大的计算机被广泛地应用在各个领域.越来越多的科学上和工择上的问题， 
在某种意义上讲，用离散的或数字化的数据来处理胜过用连续的数据来处理.差分方程往往是 
分析这样的数据的合适工具，甚至当使用微分方程作连续过程的模型时，其数值解也常常由一 
个相关的差分方程得到. 

本节中强调一些线性差分方程的基本性质，它们可通过线性代数得到很好的解释. 

离散时 间信号 

离散时间信号的向量空间 S 在 4.1 节中引人， S 中一个信号是一个只定义在整数上的函数， 
同时可用一个数列将其直观化，即{%}.图 4-27 中展示出三个典型的信号，它们的通项分别是 
(0.7)*,1*和(-1)\ 


外 =0 . 7 * y*=l* yt=(-l) 1 

1 I 1 1 r , Ml 1 MI ,1,1,1, 

- 2-1012 - 2-1012 ~—2 I ~ 0 ~ I ~ 2 ~ J ~ 

图 4-27 S 中三个信号 

数字信号显然来自电学和控制系统工程学，但离散数据序列也来自生物学、物理学、经济 
学、人口统计学以及其他任何需要在离散时间区间测量或抽样的过程的领域.如果一个过程从 
一个指定的时间开始，用形如…)的序列去描述一个信号有时是方便的.对于 it <0的 
%项，可以假设取值为0或者予以忽略. 

例1光盘唱机中发出的清晰的声音是以每秒44 100次的速度从音乐中抽样而成的，见图 
4-28. 在每次测量时，音乐信号的振幅用一个数字的形式记录下来，即外.最初的音乐是由各 
种频率的不同声音合成的，然而序列{%}包含足够多的信息用来复制声音中的所有频率，最高 
达到大约每秒20 000个周期，这超出了人耳所能感觉到的范围. 
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信号空间 S 中的线性无关性 


为了简化符号，我们考虑一个仅包含三个信号和 { hU 的集合 S ， 当方程 

CiMt +C 2 Vt +C 3 Wt =0 对所有灸成立 （1) 

蕴涵 C ,= C 2 = C ,=0 时，恰好是线性无关的.这里说“对所有 it 成立”指对所 
有整数——正整数、炉、整数和0均成立.我们可能考虑从*=0开始的信号，例如，这时“对所 
有灸 成立”将表示对所有 A >0的整数成立. 

假设 c ,， c 2 ， C 3 满足 （ 1 ) 式，那么方程 （ 1 ) 对任意三个相邻的值 K + 1 和 A + 2 成立，这样 （ 1 ) 

蕴涵 


C|M 1+ 1 + C 2 v t+1 + CiW k+i = 0 对所有灸成立 
ClU k+2 + C 2 V k+2 + C 3 W k+ 2 = 0 对所有灸成立 

从而 C |， C 2 , C 3 满足 

u k v k w k 

V t+1 w k+i 
Uk+2 V k+ 2 W k + 2 

这个方程组的系矩阵称为信号的 Casorati 矩阵，这个矩阵的行列式称为 { H t }，{ v t },{ n ^ 的 
Casorati 行列式.如果对至少一个 A 值 Casorati 矩阵可逆，则 （ 2 ) 将蕴涵 c,=c 2 =c 3 =0, 这就 
证明这三个信号是线性无关的. 

例 2 证明广 (-2 /和 Y 是线性无关的信号.见图 4-29. 



Cl 


"o' 


Cl 

= 

0 

i 

_C 3 


0 


对所有 t 成立 


" 1 * (- 2 )* 3 * 

解 Casorati 矩阵是 广 1 (-2) t+1 3 t+1 

\ M (-2) k+2 3 t+2 

通过行变换可相当简单地证明这个矩阵总是可逆的，然而，若用 A =0 代替 A ， 则会更快地 
行化简这个数值 矩阵： 


"i i r 

1 -2 3 


■i i r 

0-3 2 


1 

0 

i r 

-3 2 

1 4 9 」 


0 3 8_ 


0 

0 10 


这个 Casorati 矩阵对 A = 0可逆，所以 l \ (-2) k 和 3* 是线性无关的. 



图 4 -29信号 1*，（-2)*和 3* 


■ 
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若 Casorati 矩阵不可逆，相应的信号通过检测可能线性相关也可能不是线性相关（见习题 
33 ). 但是可以证明，如果这些信号是同一个齐次差分方程(将在下面描述）的所有解，则 Casorati 
矩阵对所有 * 是可逆的且这些信号是线性无关的，否则 Casorati 矩阵对所有 A 都不可逆且这些 
信号是线性相关的.一个用线性变换方法的较好的证明可在学习指导中找到. 


线性差分方程 


给定数量办，… ，〜， 叫 和〜不 为零，给定一个信号{心}，方程 

a 0 y t+n + a l y t+n ^+--- + a „- l y ^ l + a n y k = z k 对所有灸成立 （3) 

称为一个《阶线性差分方程（或线性递归关系）.为了简化， a 。通常取为 1. 若是零序列， 
则方程是齐 次的； 否则，方程为非齐次的. 

例 3 在数字信号处理中，像上面 （3) 那样的差分方程用来描述一个线性滤波器， ao ,-, a n 
称为滤波器系数，若将看作输人，看作输出，则对应齐次方程的解是过滤掉的信号， 
并被变换成零信号，让我们向如下滤波器输人两个不同的 信号： 


0.35 y t +2 +0.5 y t+1 +0.35 y t = Zk 

这里 0.35 是 75/4 的简写，第一个信号是由连续信号 y = cos ( W /4) 在整数值 f 抽样而生成， 
如图 4-30 a 所不.离散信号是{% } = {• • • , cos (0), cos ( ti / 4), cos (2 rt / 4), cos (3 rt / 4),• ■ •} • 

为了简单，用 ±0.7 代替 ±7^/2, 从而 

{ y * } = {•••,1,0.7, 0,-0.7 ; -1,-0.7 > 0,0.7 > 1, 0.7,0,•••} 



图 4-30 具有不同频率的离散信号 


表 4-2 展示出输出序列的一个 计算. 这里 0_35(0.7) 是 (75/4)(75/2) = 0.25 的简写，将 
{ z ,} 移动一项，输出就成为{%}. 





向量空间 


247 


于是一个不同的输人信号由更高的频率信号 y = cos (3 w /4) 生成，见图 4-30 b . 用与前面相同 
的抽样率去抽样，我们得到一个新的输人 序列： 

{咐} = {-..，1，-0.7,0,0.7，-1，0.7,0，-0.7，1,-0.7,0-_} 

1 

当将 { m } 输人给滤波器，则输出是零序列，若一个滤波器使{外 } 能够通过，但将高频的（叫 } 
截掉，则称该滤波器为低通滤波器 • 

在许多应用中，序列由差分方程 （3) 的右端确定，满足 （3) 的一个{外}称为这个方 
程组的一个解.下一个例子表明对一个齐次方程如何 求解. ■ 

例4齐次差分方程的解通常具有形式外= 〆 对某『成立，求下列方程的解_ 

y k + 3 - 2 y k + 2 - 5 y t + l + 6 y k =0 对所有（成立 （4) 

解 用 〆 代替方程 中的外 ，并将左边分解因子- 

r M - 2 r k+2 - 5 r k+l + 6 r k =0 (5) 

r t ( r 3 -2 r 2 -5 r + 6) = 0 

r t ( r - l)(r + 2)( r -3) = 0 (6) 

由于 （5) 等价于 （6), 〆 满足差分方程 （4) 当且仅当 r 满足 （6)， 于是1*，(-2)*和 3* 都是 
(4) 的解，比如，为验证 3* 是 （4) 的一个解，计算 

3* +3 _2-3 t+2 -5-3 t+1 +6-3* =3*(27-18-15+ 6) = 0 对所有灸成立 ■ 

一般而言，一个非零信号 〆 满足齐次差分方程 

y k+n + a , y t+ „_, + • • • + a „-, y k+ i + a n y k =0 对所有灸成立 
当且仅当/ •是辅助方程 

r " + a ， _1 + ••• + a„_,r + a „ =0 

的一个根，我们将不考虑当 r 是辅助方程的重根的情形.当这个辅助方程有复根，则差分方程 
具有形如 / costo 和夕 sinto 的解，其中 S 和 to 是常数，这在例3中已出现过 • 

线性差分方程的解集 

给定心…，〜，考虑映射 r : s -> s ， 将信夸{外}变换到信号{叫}，由下式给出 
w k = y k+n -\- a x y k+n ^ + ■•• + a nM y t+i + a „ y k 
容易验证 r 是一个线性 变换. 这蕴涵齐次方程 

yt+ n + aiyt +n -i + ■•■ + a n - i } , n-i = 0对所有々成义 
的解集是 r 的核（经 r 映射到零信号的信号的集合），进而这个解集是 s 的一个子空间，任何解 
的线性组合仍然是解. 

下一个定理是一个简单但基本的结论，它将引导出关于差分方程组解集的更多的信息_ 

定理 16 若〜 *0 且 { z t } 给定，只要凡,…，；^-,给定，方程 

yk+n +<21^+11-1 + + + l +< 1 nyk = Zk 对所有（成立 （7) 


有惟一解. 
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证若 y 。， …，给定，利用 （7) 定义 

yn = Zo -+ ■■■ + a n ^, y , + a „ y 0 ] 

现在 y , ,.•.，％明确了，再利用 （7) 定义 y „ +l . —般地，利用递归关系 

= z*-[<2|；yt+ n -i +… + (8) 

对灸彡0定义 y „ + t . 对々<0,为了定义％，利用递归关系 

yt - -_ G - Vyk+n + aiyk + n^i + ■■■ + a n . l y k+ J ( 9 ) 

a „ a n 

这样生成了一个满足 （7) 式的信号.反之，对任何&，满足 （7) 式的任何信号一定满足 
(8) 和（9)，所以 （7) 的解是惟一的. ■ 

定理17 n 阶齐次线性差分方程 

yk + n + 0|^+„-1 + ■■■ + a n -, y t+l + a „ y t =0 对所有灸成立 （10) 

的解集 W 是一个 n 维向量空间. 

证我们早已解释过为什么 W 是 S 的一个子空间.对 W 中的{%},设 Hr } 是 R " 中的向量 
( yo , yu -, y ^)- 容易证明是一个线性变换.任给 R ” 中向量（化九…，；^,)，由定理 
16知存在 W 中惟 一一 个信号{外 } 使得 

F { yk } = ( yo , y l ,---, y „- 1 ) 

这说明尸是由 W 到] T 上的一对一线性变换，即 F 是一个同构，从而 dimW = dimR ” = « .(见 
4.5 节习题 32). ■ 

例5对差分方程 

y » + 3 -2 y k+2 -5 y M +6 y k = 0 ,对所有 灸成立 

求其解集的一个基. 

解 我们在线性代数中的工作现在真的要给我们回报了!从例2和例4知道1\(-2)^和 Y 是 
线性无 关解. 一般地，直接证明一个信号的集合生成差分方程的解空间可能是困难的，但在这 
里因为有两个关键定理——定理17和 4.5 节中的基定理，所以使得我们的工作很容易完成，由 
定理17知，本例中方程的解空间恰好是3维的，'再由 4.5 节中基定理知，/!维空间中含 n 个向 
量的线性无关集必然是一个基，所以广 (-2 /和 3* 构成解空间的一 个基. ■ 

描述 （10) 式的“通解”的标准方法是对所有解构成的子空间给出它的一个基’这样的基 
称为 （10) 的基础 解系. 实际上，如果我们能找到„个线性无关的信号满足 （10) ，它们必然生 
成这个 n 维解空间，就像我们见到的上面的例题那样. 

非齐次方程 

非齐次差分方程 

y t+ „ + a , y t+ „_, + • • • + a „_, y k+] + a n y k = z k 对所有灸成立 （ 11 ) 

的通解能写成 （ 11 ) 的一个特解加上对应齐次差分方程 （10) 的一个基础解系的任意线性组合. 
这个结果类似于 1.5 节中关于和 Ac =0 的解集的关系，二者是类似的.这两个结果有相 
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同的 意义： 映射 jchAjc 是线性的， （11) 中将信号{外}变换成信号 ( z t ) 的映射也是线性的，见 
习题 35. 

例6证明信号力=^满足差分方程 

y i+2 — 4 y l+ i +3 y t =- 4 k . 对所有 A : 成立 （12 ) 

然后给出这个方程所有解的一个刻画- 
解 将 （12) 左端中的外用 P 代替. 

(Jt + 2) 2 -4 (ifc + l ) 2 +3 A : 2 

= ( ik 2 +4 it +4)-4{ ifc 2 +2 it + l )+3 Jt 2 
=^k 

所以 it 2 的确是 （12) 的一个解.下一步是解齐次方程 

yt*2 -4 y * + , + 3 y t =0 ( 13 ) 

辅助方程为 

r 2 -4 r +3 = ( r - lXr -3) = 0 

根为 r = l , 3,所以齐次差分方程的两个解为 1* 和3*，显然它们彼此不是倍数关系，所以它 
们是线性无关信号 •（ 也可用 Casorati 检验）.由定理17,此解空间是2维的，所以3^和构 
成 （ 13 > 的解集的一个基，该解集用非齐次差分方程 （ 12 > 的特解形式写出来，得到 （12) 的 
通解： 

t l + c , l *+ c 2 3 t ^*: 2 + c 1 + c 2 3* 

图 4-31 给出两个解集的几何直观解释，图中每个点对应 S 中的一个 信号. 



图 4-31 差分方程 （ 12 ) 和 （ 13 ) 的解集 ■ 

化简 成一阶 方程组 

研究《阶齐次线性差分方程的现代方法是用等价的一阶差分方程组代替它，其中一阶差分 
方程写成如下 形式： 

x i+ , = Ax t . 对所有 A : 成立 
这里向童4在1«"中. A 是一个 /IX/I 矩阵. 

这样的 （ 向量值）差分方程的简单例子在 1.9 节中已经研究过.进一步的例子将在 4.9 节和 
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5.6 节中给出. 

例7将下列差分方程写成一个一阶方程组： 

yk + i ~2 y k+2 ~5 y k+i + 6 y k = 0 ,对所有 k 成立 

解对每个 I 设 

- y^\ 

_^ + 2_ 

由差分方程得 +5 j t +1 +2 j t+2 ,所以 



' 

= 

0 + y t+l +0 

0 +0 + y k+2 

__ 

" 0 1 O ' 

0 0 1 





_~(> yk +5 y k + l +2 y t+2 _ 


-6 5 2 

. h +2 _ 


r o 1 o' 

即: r t +1 = At t 对所有灸成立，这里 0 0 1. 

-6 5 2 

一般而言，方程 

y t+ „ + aij t+ „_, + ... + an _ 1；yt+1 + an y k =o , 对所有 /t 成立 
可重写成: r t+1 = Ar t ，对所有成立，这里 


a = 


， A = 

' 0 1 0 … o ■ 

0 0 1 0 

: : 


• 

_yk+n-l_ 


0 0 0 1 

_~ a « ~ a n-l … —a t 
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练习题 


可以证明信号 2 *, 3 * sin 竺和 3 * cos 竺是 
2 2 

細一 2y k+1 + 9y k+i -18 y * =0 

的解，证明这些信号构成这个差分方程所有解集的一个基 
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习题 4.8 

验证习题1和习题2中的信号是相应差分方程 
的解. 

1. 2*， M )* ; ; v * +2 + 2; v u ,-8; v *=0 

2. 3 l ， (- 3) 1 ; 如 - 9 沁 =0 

证明习题3 〜 6中的信号分别构成相应差分方 
程解集的一个基. 

3. 习题1中的信号和方程. 

4. 习题2中的信号和方程. 

5. (-3)*,/:(-3) 4 ;>>, +2 +6>-, + , +9>- t =0 

6. 5*cos¥ ， 5*sin^;;y* +2 +25y t =0 

在习题7 〜 12中，假设列出的信号是给出的差 
分方程的解，确定这些信号是否构成相应方程解空 
间的基. 

7. l*，2 l ，（一2)*;;y M _ 力+2 -4y t+1 + 4>> 4 = 0 

8. 2*，4*，(-5)*;; v “ 3 - y k+2 - 22 y M + 40^ ( = 0 

9. l *，3 l cos - y ,3* sin ^-; y M - y it2 + 9 y M - 9 y k =0 

10. (- l ) l ，*(- l )*，5* ; ; v * +3 -3>> t+2 -5y t =0 

11. (-1)*,3*;j> 1+3 + >> t+2 -9>- t+l -9>> t =0 

12. -2>> t+2 + >>» =0 

在习题 13~16 中，分别求差分方程解空间的一 
个基 

2 

13. u +l +~y k =0 

14. y k+2 -7yk+i +12y* =0 

15. y k + 2 ~ 25 y k =0 

16. \ 6 y k + 2 -^ Sy k + l - 3 y k =0 

在习题 17 和习题 18 中，涉及到国民经济的一 
个简单模型，用下列差分方程描述 

Y k+2 -a(\+b)Y t+l +abY k =\ ( 14) 

这里 F * 是第 A 年国民收入总和， a 为一个小于 
1的常数，称之为边际消费倾向，6是一个正的调 
节常数，用来刻画消费性开支对一年的私人投资率 


的影响如何变化 . 3 

17. 当 a = 0.9,* = l 时，求 （14) 的通解，当*增 

9 

加时，如何变化？（提 示： 先求形如 y t =r 
的特解，这里 r 是一个常数，称为国民收人的 
平均水平 .） 

18. 当 a = 0.9，* = 0.5 时，求 （14) 的通解. 

一个轻的悬梁被间隔10英尺的 W 个支点支撑 

着，一个重500磅的法码挂在悬梁的一端，它距第 
一个支点10英尺，如图 4-32 所示.设; y , 表示第女 
个支点的弯矩，则 y , =5000英尺-磅.假设这个悬 
梁刚性地连接在第 W 个支点上并且此处弯矩为 
零，则各弯矩满足以下3-弯矩 方程： 
>^+4>^ 1 +>> ( =0对* = 1，2，...，〜-2成立（15) 

卜10 英尺英尺 》卜10 英尺 

A A A «»« A 

图 4-32 悬梁上的弯矩 

19. 求差分方程 （15 ) 的通解. 

20. 求满足边界条件; v , =5000,= 0的 （ 15 ) 的特 
解（答案涉及 ah . 

21. 当一个信号通过在一个过程中（化学反应、通 
过管子的热流、活动机械手等等）的一系列测 
量生成时，这个信号通常包括由测量误差造成 
的随机噪声.预处理这些数据以便减少噪声的 
标准方法是将这个数据打磨，或叫过滤.一个 
简单的过滤法是用两个相邻值的平均数代替 
每个 h 的移动平 均数： 

- y*+i + 金 + - yk-i = Zk^i k =1,2广.均成立 


O 例如，可参考 ZXscrete James T. 

Sandefur (Oxford: Clarendon Press, 1990)，pp.267-276, 
最原始的加速乘数模型由经济学家 P. A. Samuelson 
提出. 
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假设对 * =0,…，14, 一个信号 : V * 是： 
9,5,7,3,2,4,6,5,7,6,8,10,9,5,7 
利用过滤法计算^，…,作一个原始信号和 
打磨过的信号的双重折线图. 

22. 设是由连续信号 2 cos + + cos + 在 

r = 0， l ，2，... 处抽样生成的，如图 4-33 所示.从 
*=0开始的 ％ 值为3, 0.7, 0, -0.7, -3, 
-0.7, 0,0.7, 3, 0.7, 0,….这里0_7是 V 5/2 的简 
写. 



图 4-33 由 2 COS $ + COS ^ 得到的抽样数据 
4 4 

a . 当 I %}提供给例3中的滤波器时，计算输 
出信号 

b . 解释为什么 （ a ) 中输出与例3中的计算相 
关，有怎样的关系？ 

在习题23和24中，对适当的常数 a 和涉 
及一个形如 如-吵 = b 的差分方程 • 

23. 10 000美元的贷款每月有1%的利息和 45 0美 
元的月供.一个月之后在 *=1 时办理第一次 
付款.对; t =0， l ，2，...， 设％是第 * 次月度付款 
刚办理后贷款的未付余额，则 

>-, = 10000 +(0.01)10000 - 450 : 

新余额还贷额附 fn 利息月供 

a . 写出 Ihl 满足的差分方程. 

b . [ M ] 作一张表展示月份*时*与余额 h ， 
列出你作这张表的程序和按键. 

c . [ M ] 当作完最后的付款时，为多少？最后 
一次的付款是多少？借款者共支付多少 
钱？ 


24. 在时间*=0，办理了一个1000美兀的最初存 
款的储蓄账户。这个储蓄账户每年付6%的利 
息 （每月 利率为 0.005 ), 这个利息按每月复利 
计算。在最初存款之后，每月将200美元存到 
账户里。对 A = 0， l ，2 …，设％表示在时间 刚 
办理完存款后账户里的存款金额. 

a . 写出满足的差分方程. 

b . [ M ] 作一张表，展示 A 与在月份*时账户里 
的总金额， A 取* =0到60.列出你作这张 
表的程序和按键. 

c . [ M ] 两年（即24个月）之后，账户里有多 
少存款？ 4年和5年之后呢？ 5年的总利息 
是多少？ 

在习题25~28中，证明给出的信号是相应差分 
方程的解，然后求差分方程的通解. 

25. y k =* 2 ;>>» + 2 + 3 j > t + i -4 y , =10<: + 7 

26. y k = l + k \ y t ^ -8 y t+1 +15 y t =Sk + 2 

9 

27. y t = 2 - 2 k -, y M -- y M + 2 y t = 3 k + 2 

28. y , =2 fc -4; j - u 2+|>'* + i - y * =1 + 3* 

将习题 29 和习题 30 中的差分方程用一阶方程 
组(对任意成立）的形式写出来. 

29. 如 _6細 + 8加 + 6>-» + , - 9 y k =0 

3 1 

30. 細-7 r yt = 0 

31. 下列差分方程是 3 阶的吗？解释之. 

>-, +3 + 5>-* + 2+6>>* + , =0 

32. 下列差分方程的阶是多少？解释你的答案. 

細 + a , y k+ i + a 2 y k M + a 3 ; y * = 0 

33. 设》=* 2 々=2)^1,信号和 U 1 线性无 
关吗？对 fc = 0，*=- l 和灸= 一 2 ，求相应的 
Casorati 矩阵 C ( fc ), 并讨论你的结果. 

34. 设 /， g ，/! 是定义在全体实数上的线性无关函 
数，通过取整数上的函数值抽样构造3个信 
号： 

u t = f ( k ), v k = g ( k ), w t = h { k ) 
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在 S 上这些信号一定是线性无关的吗？讨论之. 

35. 设 a 和6是非零数，定义映射 = ，其 

中 vv » = y M + ay M + by k ,证明 r 是一个由 S 到 
S 中的线性变换. 

36. 设 V 是一个向量空间， r : v->v 是一个线性变 
换.给定 zev , 假设满足, 
设 H 是 r 的核中的任一向量，证明 H + JC , 满足 

练习题答案 

检査 Casorati 矩阵： 


非齐次方程 r ( Jt ) = z . 

37. 设 S 。 是所有形如（:>>。，>> 1 ，>> 2 ，...）的序列的向量空 
间，定义从 S 。 到 S 。 的线性变换 r 和 D 如下： 
?X;yo ， y, ， y 2 ，… ） = ( a ， y 2 ， y 3 ， …） 

证明 773 = / U 是 S 。 上的恒等变换）但 D 7 V /. 


2> k cos — 

2 

3 u ' cx ) s (A： + 1)7t 
2 


C (*) = 


l k 3 *sin — 

2 

2 i+, 3 t+, sin^i^ 

2 

2 t+J 3 ^ sin (*±^E 3 * + 2 cos (* + 2)Jt 


设* =0, 将矩阵进行行化简，证明它有3个主元位置，从而矩阵 可逆: 



io r 


"i o r 

C (0) = 

2 3 0 

- 

0 3-2 


4 0-9」 


0 0 -13 


当女=0时， Casorati 矩阵是可逆的，所以这些信号是线性无关的，因为有3个信号，差分方程的解空间// 
是3维的（定理 17), 由基定理知，这3个信号构成//的一个基. 


4.9 马尔可夫链中的应用 


本节中描述的马尔可夫链，在许多学科如生物学、商业、化学、工程学及物理学等领域中 
被用来做数学 模型. 在每种情形中，该模型习惯上用来描述用同一种方法进行多次的实验或测 
量，实验中每次测试的结果属于几个指定的可能结果之一，每次测试结果仅依赖于最接近的前 
一次测试. 

例如，若每年要统计一个城市及其郊区的人口，像 
「0.601 

X 。叶 0_4oJ (1) 

这样的向量可以显示60%的人口住在这个城市中，40%的人口住在 郊区. x 。 中的小数加起来等 
于1是因为它们说明这个地区的总人口，在此对我们的目的而言，用百分数表示比用人口总数 
表示更方便. 

一个具有非负分量且各分量的数值相加等于1的向量称为概率 向量； 随机矩阵是各列向量 
均为概率向量的 方阵； 马尔可夫链 是一个概率向量序列…和一个随机矩阵 P ，使得 
Xi =Px 0 , x 2 =Px u jt 3 =Pjt 2 ，. 
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于是马尔可夫链可用一阶差分方程来刻画： 

x lt i=Px t ,k = 0X2,- 

当向盘在 R " 中的一个马尔可夫链描述一个系统或实验的序列时 ，心中 的数值分别列出系 
统在 n 个可能状态中的概率，或实验结果是《个可能结果之一的概率.因此， A 通常称为状态 
向置. 

例 1 在 1.9 节中，我们研究过一个人口在城市与郊区之间移动的模型，见图 4-34, 在大 
城市地区的这两个部分之间，每年的移民由移 民矩阵 Af 控制： 

由城市 郊区去 

|"0.95 0.03"| 城市 
M _ [0.05 0.97』郊区 

即每年有 5% 的城市人口流动到郊区，有 3% 的郊区人口流动到城市， A / 的列是概率向量，所以 
A / 是一个随机矩阵.假设在 2000 年这个地区的城市人口为 600 000, 郊区人口为 400000, 所以 
这个地区原来的人口分布由上面 （1) 中的和给出，2001年人口的分布是什么？ 2002年呢？ 




民 主党得票率 ( D ) - 
共和党得票率(灼 
自由党得票率 ( L ) 
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假设我们用这种类型的向量每两年记录一次国会选举的结果，同时每次选举的结果仅依赖 
前一次选举的结果，于是刻画每两年选举的向量构成的序列是一个马尔可夫链，对此链，作为 
一个随机矩阵的例子，取 

从 D R Z ■到 

0.70 0.10 0.30] d 

P = 0.20 0.80 0.30 R 

0.10 0.10 0.40 」 i 

标志为 “ D ” 的第一列中的数值刻画在一次选举中为民主党投票的人在下一次选举中将如 
何投票的百 分比. 这里我们已经假设70%的人在下一次选举中再一次投“£>”的票，20%的人将 
投的票，10%的人将投 “ L ” 的票，对的其他两列有类似的解释，图 4-35 给出这个矩阵 
的一个图表. 



如果这些“转换”百分比从一次选举到下一次选举多年保持为常数，则那些给出投票结果 
的向量的序列构成一个马尔可夫链.假设在一次选举中，结果为 

"0.55" 
x 0 = 0.40 
0.05 

确定下一次可能的结果和再下一次可能的结果. 

解 下一次选举的结果由状态向量^描述，再下一次选举的结果由 jc 2 描述，这里 

"0.70 0.10 0.30][0.55] [0.440] 44%将投 d 的票 
x l = Px 0 = 0.20 0.80 0.30 0.40 = 0.445 44.5% 将投 R 的票 
0.10 0.10 0.40 0.05 0.115 11.5% 将投 z ■的票 
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'0.70 0.10 0.301 [0.440] 「0.387 0") 38.7%将肋的票 
x 2 =Px t = 0.20 0.80 0.30 0.445 = 0.478 5 47.8%将 S / 納票 
0.10 0.10 0.40 儿 0.115」|_0.1345」 ■将 _票 
为了搞清楚为什么 jc , 事实上给出了下一次选举的结果，假设1000个人在“第一次”选举 
中投票，550人投 D 的票，400人投/?的票，50人投 L 的票（见 jc 。 中的百分比）.在下一次选 
举中，550人中的70%将再一次投 D 的票，400人中的10%将从/?转投 D , 50人中的30%将从 
L 转投£>，于是 D 的总得票数为 

0.70(550) + 0.10(400) + 0.30(50) = 385 + 40+15 = 440 ( 2) 

于是下一次 D 的候选人将得44%的选票 ， （ 2 ) 中的计算本质上与计算&中第一个数值是相 
同的，对 A 中其他数值以及 jc 2 中的数值等可以作类似的计算. ■ 

预言遥远的未来 

马尔可夫链最有趣的方面是对该链长期行为的研究.例如，在例2中经过多次选举以后， 
关于投票的情况我们能说些什么？（假设从一次选举到下一次选举，给定的随机矩阵连续描述 
转换百分比 .） 另外，从长远看，例1中的人口分布将有什么样的结果？在回答这些问题之前， 
我们先讨论一个数值的例子. 

'0.5 0.2 0.3] IY 

例3令/>= 0.3 0.8 0.3 , x 0 = 0 , 考虑一个系统，它的状态由马尔可夫链 h +1 =/^ 
0.2 0 0.4 J [o 

(^=0,1,-) 描述.随着时间的流逝，这个系统将有什么 结果？ 为此，计算状态向量&…〜来 
寻找结果. 

解 后面向量中的数值保留4位或5位有效数字. 

"0.5 0.2 0.3]「1"|「0.5— 
x,=Px 0 = 0.3 0.8 0.3 0 = 0.3 
0.2 0 0.4 0 0.2 

"0.5 0.2 0.3][0.5 l 「0.37. 
x 2 =Px t = 0.3 0.8 0.3 0.3 = 0.45 

0.2 0 O . 4JL0.2 0.18 

"0.5 0.2 0.3][0.37] [0.329 
x 3 =Px 2 = 0.3 0.8 0.3 0.45 = 0.525 
.0.2 0 0.4 j [0.18 j 0.146 

继续用这种方法，有 

"0.313 31 |"0.306 41 |"0.303 2 l ("0.3016_ 

^4 = 0.562 5 , x 5 = 0.5813 , x 6 = 0.590 6 , x 7 = 0.595 3 
0.1242」 [0.1123」 L°- 1062 J [ q .1031 
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0.3008] 「0.3004"| 「0.3002") 「0.3001— 

x 8 = 0.597 7 ， x 9 = 0.598 8 , x 10 = 0.599 4 , x „ = 0.599 7 
—0.1016」 [0.1008」 [ o,100 4 0.100 2 

"0.300 05 l 「0.30002") [0.300 011 「0.300 Of 

x, 2 = 0.599 85 , x, 3 = 0.599 93 , x 14 = 0.59996 , x 15 = 0.59998 
0.10010」 [0.100 05」 L 0 . 10002 J [ o.IOOOI 

"0.3 l 

这些向量似乎是逼近 0. 6 的. 这些概率由（的一个值到下一个值几乎不改变，注意到 
0.1 

下列计算是精确的 （ 没有舍人误 差）： 

"0.5 0.2 0.3 l 「0 J ] [0.15 + 0.12 + 0.031 「0.30— 

Pq= 0.3 0.8 0.3 0.6 = 0.09 + 0.48+0.03 = 0.60 =q 

0.2 0 0.4」[ O.lJ |_0.06 + 6. +0.04 0.10 

若系统处于状态 g ， 则从一次测量到下一次测量，系统没有变化. ■ 

稳态向置 

若 P 是一个随机矩阵，则相对于/>的稳态向置（或平衡向置）是一个满足 

p 9=9 

的概率向量 f 可以证明每一个随机矩阵有一个稳态向量，上面的例3中， 9 是/>的一个 
稳态向量. 

例4在例1中，概率向量 g = 是人口迁移矩阵 M 的一个稳态向量.这是因为 

M = |"0.95 0.031 I - 0.3751 = T 0.356 25 + 0.018 75] _ ro .375] _ 

? _ L ° 05 0.97 J [0.625 J _ [ o .018 75 + 0.606 25 j = [ o .625 j = 9 ■ 

在例 1 中，若大城市地区的总人口是 1 百万，则由例4, g 将对应有375 000人在城市，有 
625 000人在郊区，在一年的年底，从城市迁出的人口是 
(0.05) (375 000) = 18 750 

人，从郊区迁进城市的人口是 (0.03) (625000) = 18750 人. 结果是，城市里的人口保持不变，类 
似地，郊区里的人口也是稳定的. 

下一个例子说明如何求稳态向量. 

例5令尸=[^ ^|，求尸的稳态向量. 

解首先，解方程 Px = x . 


办-太=0 

Px-Zr =0 回顾 1.4 节有 Zr = ：c 

( P -/) x =0 
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'-0.4 0.3" 

0.4 -0.3 


r~r I r I j ru . 

01 r-0.4 0.3 Ol |"1 -3/4 0" 
0 」~|_ 0 0 0 0 


对上面的 P ， 

为求 ( P -/) jc =0 的所有解，将增广矩阵作行化简 
["-0.4 0.3 

L 0.4 43… 

于是;&为自由变量，通解为; 

其次，对此解空间选一个简单的基.一个显然的选择是但一个更好的没有分数的选 
择是 w =^j (对于 A = 4 ) • 

最后，在 Pjc = ji : 的全体解的集合中求一个概率向量，这是简单的，因为每个解均为上面 w 
的一个倍数，将 w 除以其数值之和得 

检验之，计算 

_「6/10 3/101 p /7 l _ ["18/70 + 12/701 _ p 0/70 l ■ 

P? = 1_4/10 7 /loJ L 4/7 J _ [ l 2/70 + 28/7 oJ _ |_40/7 oJ -? 

下一个定理将证明，例 3 中产生的结果是许多随机矩阵的一个典型代表.我们说一个随机 
矩阵是正则的，如果矩阵的某次幂 P * 仅包含正的数值，对例3中的 P ， 有 
'0.37 0.26 0.33' 

P 2 = 0.45 0.70 0.45 
0.18 0.04 0.22 
由于户中每个数是严格正的，故 P 是一个正规随机矩阵. 

另外，我们说一个向量序列当& 4 00时，收敛到一个向量如果当&充分 
大时， JC , 中的数值无限接近 g 中对应的数值. 

定理18若是一个 nxn 正规的随机矩阵，则/>具有惟一的稳态向量进一步，若知是 
任一个起始状态，且心 + ,=/^，*=0,1,2,...，则当*400时，马尔可夫链 { jc *} 收敛到 《• 


这个定理的证明可在马尔可夫链方面的标准教科书中找到，这个定理的奇妙之处在于初始 
状态对马尔可夫链的长期行为没有影响.稍后（在 5.2 节）你将看到为什么这种情况对这里研 
究的多个随机矩阵是真实的. 

例6在例2中，假设选举结果构成一个马尔可夫链.问从现在开始经过多年若干次的选 
举之后，投票者可能为共和党候选人投票的百分比是多少？ 

解 若用手工计算，错误方法是选某初始向量 JC 。， 再对充分大的&计算 JC, ， -, X*, 这样没 
办法知道要计算多少向量，并且你不能把握 h 中数值的极限值. 
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正确方法是计算稳态向量再借助定理18,给定例2中的矩阵 P ， 通过对角线上每个数值减 
去1得到 P -/， 再将增广矩阵进行行 化简： 

"-0.3 0.1 0.3 0' 

[(/>-/) 0]= 0.2 -0.2 0.3 0 

0.1 0.1 - 0.6 0 

回顾前面的工作，通过每一行乘以10,可以使运算简化 . e 

'-3 1 3 0] [1 0 -9/4 0" 

2 -2 3 0 - 0 1 -15/4 0 

1 1 -6 0_| |_0 0 0 0 

(/^ /)X = 0 的通解为 ^1 = " 7-^3 )-^2 = 是自由变量. 

4 4 

选; c 3 =4, 得到解空间的一组基，它的每个数值是整数，由此容易求得隐态向量，它的数 
值之和为 1. 

' 91 I " 9/28] [0.32 — 

h »= 15 , q= 15/28 » 0.54 
_ 4」 [4/28 J [0.14 

q 中的元素刻画由现在开始多年之后进行的一次选举中得票数的分布 （ 假设这个随机矩阵 
连续描述从一次选举到下一次选举的变化情况）.这样，最终大约54%的选票被共和党候选人 
得到. ■ 

数值计算的注解你可能已注意到若 x , +l =/^， *=0，1，2,..., 则 
x 2 =Px x = P(Px 0 ) = P 2 x 0 

一般地， 

X k = P * x 0 , 灸=0 ,1,2 ，". 

为了计算一个向量，比如 JC 3 , 则将 A ， JC 2 先算出来再计算1也只需要少的算术 

运算，而先计算 P 3 和 P 3 jc 。 则 不然. 然而，若很-比如是 30 x 30 的矩阵，对这 

两种方法，机器计算 x 3 的时间没有什么区别，计算尸 3 x 。 的指令+以作为首选，因为它 
需要较少的键击次数. 

练习题 

1 . 假设一个城市地区的居民按照例1中移民矩阵的概率进行迁移，假设某个居民“随机”选择去向.则 
一确定年度的状态向量可以理解为给出了当时这个人是城市居民还是郊区居民的概率. 

a . 假设现在这个人是城市居民，所以这个人下一年住在郊区的可能性有多大？ 

b . 这个人两年后住在郊区的可能性有多大？ 


Q 注： 不仅仅对尸乘以 10. 事实上.是对方程（尸-/)* = 0的增广矩阵乘以 10. 
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2 . 令 0：8]'^[ o ：7 3 ]' 向量發是否为^的稳态向量？ 

3. 例1中多年之后住在郊区的人口的百分比是多少？ 

习题 4.9 


1. 一个偏僻的小村子从两个广播站接收无线电广 
播.其中一个是新闻广播站，另一个是音乐广 
播站.在广播站每半小时一次的休息后,接收新 
闻广播的听众中，有70%的人还将保持收听新 
闻，有30%的人在广播站休息时换成接收音乐 
广播.接收音乐广播的听众中，当广播站休息 
时，有60%的人将换成收听新闻广播.有40% 
的人还将保持听音乐.假设在上午8: 15,每个 
人都正在收听新闻. 

a . 给出描述无线电听众在每个广播站休息时 
趋向变换广播站的随机矩阵，将行、列做标 
记. 

b . 给出初始状态向量 . _ 

c . 听众在上午9: 25收听音乐广播的百分率是 
多少？ （ 在上午8 : 30和9 : 00广播站休息 
之后 .） 

2. 一个实验室动物每天可以吃三种食物中的任一 
种，实验室记录表明，在一次测试中，如果这 
个动物选择一种食物，在下一次测试中它选择 
同样食物的概率是50%.下一次测试中它选择 
其他两种食物的概率均为25%. 

a . 对此情形，随机矩阵是怎样的？ 

b . 若这个动物在一次初始测试中选1号食物， 
在初始测试后的第二次测试中，它选2号食 
物的概率是多少？ 



3. 在任意给定的一天.一个学生要么健康，要么 


生病.在所有今天健康的学生中，有95%的人 
明天仍然健康.在所有今天在生病的学生中， 
有55%的人明天仍然生病. 

a . 对此情形，随机矩阵是什么？ 

b . 假设在星期一有20%的学生是生病的，在星 
期二，学生中可能生病人数的百分比是多 
少？星期三呢？ 

c . 如果一个学生今天是健康的，问该学生从现 
在开始两天后仍然健康的概率是多大？ 

4. 对任意给定的一天，哥伦布地区的天气要么是 
好，要么是中等，要么是差.若今天天气好，则 
明天的天气有60%的可能是好的，有30%的可 
能是中等的，有10%的可能是差的.若今天的天 
气是中等的，则明天天气好的概率是 0.40, 天 
气中等的概率是 0.30. 最后，若今天天气差，则 
明天天气好的概率是 0.40, 天气中等的概率是 
0.50. 

a . 对此情形，随机矩阵是怎样的？ 

b . 假设今天是好天气的可能性为50%,是中等 
天气的可能性为50%,明天是差天气的可能 
性是多少？ 

c . 假设对星期一的天气预报是40%为中等天 
气，60%为差天气，在星期三是好天气的可 
能性是多少？ 

在习题5~8中，求稳态向量. 


'0.1 0.6] 

6. 

0.8 0.5] 

0.9 0.4 J 


0.2 0.5] 

0.7 0.1 0.1 


0.7 0.2 0.2' 

0.2 0.8 0.2 

8. 

0 0.2 0.4 

0.1 0.1 0.7 


0.3 0.6 0.4 


9.确定 P = &是否是一个正则的随机矩阵？ 




向量空间 
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10. 确定户=& 是否是一个正则的随机矩阵？ 


11. a . 对习题1中的马尔可夫链，求其稳态向量. 

b . 经过很长时间之后，听众中收听新闻的比例 


是多少？ 

12. a . 对习题2中的马尔可夫链，求其稳态向量. 
b . 对某个确定的人，经过许多天之后，生病的 
概率是多少？若今天这个人正在发病，对这 
个结果有影响吗？ 


13. 参考习题3,多次测试后，这个动物更喜欢哪 


一种食物？ 

14. 参考习题4,从长远看，对任给的一天，哥伦 
布地区的天气是好天气的可能性有多大？ 

15. [ M ] 加州财政部的人口研究部门为下列移民矩 


阵提供了数据，这个矩阵刻画在1989年间美国 


人口的流动情况，在1989年，大约总人口的 


11.7%居住在加州.如果给出的移民概率多年 


保持不变，问总人口中最终居住在加州的百分 
比是多少？ 

由加州 美国其他地区到 

["0.9821 0.0029] 加州 

[0.017 9 0.997 lj 美国其他地区 

16. [ M ] 在底特律， Hertz 出租车公司大约有2000 


辆小汽车，租出和返回位置的模式由下表中分 


数给出.在一天中，由市中心位置大约有多少 
辆小汽车将被租出或准备 租出？ 汽车 租出： 


由 City 机场市中心 Metro 机场回到 


"0.90 

0.01 

0.09, 

City 机场 

0.01 

0.90 

0.01 

市中心 

0.09 

0.09 

0.90」 

Metro 机场 


17. 令/>是一个 nxn 随机矩阵，下列论证表明方程 
= 有一个非平凡解.（事实上，存在一个 
具有非负数值的稳态解，其证明在进一步的教 
材中给出 .） 证明下列每个论断.（注意用一个 
定理 .） 

a . 若 />-/ 的其余行均加到最下一行，则结果 
为零行. 


b . />-/ 的行线性相关. 

c . />-/ 的行空间的维数小于 n . 


d . />-/ 有一个非平凡的零空间. 

18. 证明每一个 2 x 2 随机矩阵至少有一个稳态向量. 

任意这样的矩阵均能写成形如/ > = [ 1 = 

的形式，这里《与 )8 是0到1之间的常数.（若 
« = )8 = 0,则存在两个线性无关的稳态向量， 
否则只有一个稳态向量 .） 


19. 令 S 是一个 lxn 行矩阵，每列中只有 1. 

•S = [l 1 … 1] 

a . 解释为什么 R " 中的向量是概率向量当且仅 
当它的数值非负且 Sr = l . (像 Sr 这样的 
1 x 1 矩阵通常不写矩阵括号符号 .） 

b . 令/> 一个 nxn 随机矩阵，解释为什么 


SP = S . 

c . 令/>是一个 nxn 随机矩阵，是一个概率 
向量，证明办也是一个概率向量. 

20. 利用习题19证 明：若 />是一个 nxn 随机矩阵， 
则 〆 也是. 

21. [ M ] 检验正则随机矩阵的幂. 
a . 计算 〆， it = 2,3 ,4,5. 


—0.335 5 

0.368 2 

0.306 7 

0.0389" 

0.266 3 

0.2723 

0.327 7 

0.5451 

0.1935 

0.1502 

0.1589 

0.239 5 

0.204 7 

0.209 3 

0.206 7 

0.1765 


计算结果保留4位小数，当 A 增加时， 〆 的列 
将有什么结果？计算/>的稳态向量. 
b . 计算 G*，it = 10,20，...，80. 

[ 0.97 0.05 0.10' 

0 0.90 0.05 

0.03 0.05 0.85 

(使 G 4 的稳定性达到4位小数可能需要 * = 116 
或更大 .） 计算 G 的稳态向量.对任意正则的随 
机矩阵，猜想什么结果可能是正确的. 

c . 利用定理18解释在 （ a ) 和 （ b ) 中你所发 
现的结果. 
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22. [ M ] 对比求正则随机矩阵/>的稳态向量 g 的两 
种 方法： 

(1) 像例5中那样计算 

(2) 对某较大的数 it ，计算 〆 .再利用 〆 的 
一列当作9的近似. 

( 学习指导中描述了一个程序 nulbasis , 它几乎 
使方法 （ 1 ) 自动化 .） 

利用 * = 100 或更大的数，在你的矩阵程序允许 


的范围内，对一个随意给定的最大的随机矩阵 
做实验.对每一种方法，给出你开始按键和运 
行程序所需要的时间.（如果你有 MATLAB , 
你也可用 flaps 和 tic … toe 来记录浮点运算的次 
数和使用 MATLAB 计算总的消耗时间 .） 对比 
每个方法的优势并说出你倾向于使用哪一种方 
法. 


练习题答案 

1. a . 因为在一年之内有5%的城市居民将迁移到郊区，每个人有5%的这样的选择的可能性.关于这个人 
没有更进一步的说明，所以我们说这个人去郊区的可能性是5%.这个事实蕴涵在状态向量;^的第 
二个数值中，这里 


x l = Mxo 


"0.95 0.03T11 ("0.95' 

0.05 0.97j[oJ = |_0.05 


b . 两年之后这个人住在郊区的可能性是 9.6%, 这是因为 


2. 稳态向量满足 = 因为 


x 2 = Mx , 


"0.95 0.03l("0.95l_r0.904' 
.0.05 0.97j[o.05j - [0.096 


[0.6 0.2J0.31 J0.321 
[0.4 0.8 」 L0.7 」 [o.68j H 

我们断定 g 不是 /> 的稳态向量. 

3.例1中的 Z 1 是一个正则的随机矩阵，这是因为它的数值全是严格 正的. 所以可以使用定理18，由例4 
我们已经知道其稳态向量，所以人口分布向量心趋向 


最终有 62.5% 的人口将住在郊区. 


9 = 


'0.375' 

0.625 


第4章补充习题 


1. 对每个命题，标出是对还是错，验证每个答案. 
在 （ a )~( f ) 中， v ,, ... v , 是非零有限维向量空 
间 V 中的向量，而且 v p J . 

a . v ,, ％的所有线性组合所成的集合是一个 
向量空间. 

b . 若 { v ,,...,%—] 生成 V ,则 S 生成 V . 

c . 若 { v ,, …，是线性无关的，则也是线性 


无关的. 

d . 若 S 是线性无关的，则是 V 的一组基. 

e . 若 Spans = V ， 则 S 的某一子集是 V 的一组 
基. 

f . 若 dimV = pfiSpanS=V ,则不能是线性 
相关的. 

g . IR 3 中的一个平面是一个2维子空间. 



向量空间 __ 

h. 矩阵中的非主元列总是线性相关的. 

i. 矩阵 A 中的行变换能够改变 A 的行之间的线 
性相关关系. 

j. 矩阵中的行变换能够改变零空间. 

k. 矩阵的秩等于非零行的个数 • 

l. 若 mxn 矩阵 A 行等价于阶梯形矩阵I/，1/ 
有 Jk 个非零行，则 /U = 0 的解空间的维数是 

ffi — k. 

m. 若 fl 是由 A 经过几次行初等变换得到，则 
rank B = rank A . 

n. 矩阵 A 的非零行构成 RowA 的一组基. 

o. 若矩阵 A 和 B 有相同的简化阶梯形，则 
Row A = Row B . 

p. 若 // 是 R 3 的子空间，则存在一个3 x 3矩阵 
A 使得 W=ColA. 

q. 若 A 是 mxn 矩阵且 rankA = m ， 则线性变换 

AC 是-■的. 

r. 若是 mxn 矩阵且线性变换;《：4办是射上 
的，则 rank A = m . 

s. 坐标变换矩阵总是可逆的. 

t. 若 S = { 办，， ... A}*C = { Cl , 是向量 

空间V的基，则坐标变换矩阵的第7_列是 
坐标向量㈧ L. 

2 . 求所有形如下列形式的向量构成集合的一组基 • 

( 计算要仔细 .） 

' a -2 b + 5 c ' 

2 a + 5 b-&c 
- a-Ab + lc 
3 a -\- b-\-c 

"-2i r ii fv 

3 . 令 u, = 4 ， u 2 = 2 , b = b 2 ,1V = Span{u, , 

-6J [-5」 ！>_ 

u 2 }, 求 W 的一个隐式的 表达； 即求一个或多 
个能刻画 W 中点的齐次方程的集合.（提 示： A 
何时在 W 中？） 

4. 解释说明下面的讨论哪里 有错： 设 /W = 3 + t, 
g (, t ) = 3 t + t 2 ,因为 g(0 = /W, g 是 / 的倍数， 
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所以 {/，W 是线性相关的 • 

5. 考虑多项式 p t ( t ) = l + t , p 2 ( t ) = \-t 

= 4 , p ^ t ) = t + t 2 , p s ( t ) = l +2 t + t 2 , 并设 W 是 
由集合^㈠/^/^/^/^/^所生成的慝的子空 
间，使用 （4.3 节）生成集定理证明中给出的方 
法求//的一组基.（说明如何从^中选取适当 
的向量 .） 

6. 假设列 ，p 2 ，内 ，p 4 是给定的多项式，它们生成 
P 5 的一个2维子空间// . 试叙述通过检査这4 
个多项式，你如何能几乎不用计算就能求出 H 
的一组基. 

7. 关于一个具有18个线性方程20个变量的齐次 
方程组的解集，为了知道每一个相应的非齐次 
方程组有解，你必须要知道什么？讨论之. 

8. 令//是 n 维向量空间V的一个 n 维子空间，解 
释为什么 

9. 设 r:ir sir 是线性变换， 

a. 说明如果 r 是一对一映射，那么 r 的值域的 
维数是多少？ 

b. 说明如果 r 是从 r " 映上到 r ", 那么 r 的核 
(见 4.2 节）的维数是多少？ 

10. 令 S 是向量空间V中的一个最大线性无关子 
集，即 S 有这样的性 质：若 一个向量不在 S 中， 
添加到 S 后得到一个新的集合，则新的集合不 
再是线性无关的. 证明： S —定是V的一组基. 
(提 示： 若 S 是线性无关的，但不是V的一组 
基，则 S 将如何？） 

11. 令 S 是向量空间V的一个有限极小生成集， 
即， S 有这样的性质 ：若从 S 中去掉一个向量， 
则新的集合将不再生成V,证明 S —定是V的 
一■组基. 

12-17 题给出了有时在应用中用到的秩的性 
质.假设矩阵 A 是 mxn 矩阵. 

12. 由 （a ) 和 （b ), 证明： rank AB 不能超过 A 的 
秩或 S 的秩.（一般而言，矩阵乘积的秩不能 
超过任何一个因子的秩 .） 
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a . 若 B 是 nxp 矩阵， 证明： rank AB ^ rank A . 
(提 示： 解释为什么 A 5 的列空间中的每个 
向量属于 A 的列空间中 .） 

b . 若 fl 是 nxp 矩阵， 证明： rank AB ^ rank B . 
( 提 7 K :利用 （ a ) 研究 rank ( AS ) T .) 

13. 若尸是 mxn 可逆矩阵， 证明： rank PA = rank A . 
(提 示： 对和应用第 12 题 .） 

14. 若 (8 是可逆的， 证明： rank Ag = rank (提 
示： 用第 l 3 题来研究 rankCAg ) 1 .) 

15. 设 A 是 mxn 矩阵， B 是 nxp 矩阵，且 /!5 = o . 
证明： rankA + rankfi^n . (提 示： NuM , 
CoM , NulB , ColB 四个子空间中有一个被 
包含在另外三个中的其中一个子空间 .） 

16. 设 A 是秩为 rWmxn 矩阵，则>1的秩分解是 
具有 A = C /? 形式的等式，这里 C 是秩为 r 的 
mxr 矩阵，/?是秩为/•的 rxn 矩阵.这样的分 
解总是存在的（参见 4.6 节习题38 ). 任给两 
个 mxn 矩阵 A 和 ， 利用秩分解证明： 

rank(A + B ) < rankA + rankB 
]7. 矩阵 A 的子矩阵是由去掉 a 中若干行若干列 
( 或不去掉 ) 得到的 矩阵. 可以证明 A 的秩为 r 
当且仅当 A 包含一个 rxr 可逆子矩阵同时没 
有更大的可逆子方阵.通过解释下面的 （ a ) 

和 （ b ) 证明这个命题的一部分： （ a ) 为什么 
秩为 r 的 mxn 矩阵 A 有一个秩为 r 的 mxr 子 
矩阵, ( b ) 为什么 A 有一个可逆的 rxr 子 
矩阵烏. 

秩这个概念在工程控制系统的设计中起着重 
要的作用，比如在本章引例中提到的航天飞机系统. 
控制系统的状态空间模型包括一个形如 

= Ax t + Bu k * = 0,1 ，- •- ( 1 ) 

的差分方程，这里是 nxn 矩阵，5是 /ixm 矩阵， 

是 IT 中的一个“状态向量”序列’它用来描 


述在离散时间上系统的状态，{+}是一个控制或输 
入序列. （ A ， fl ) 称为可控制的，如果 

rank[B AB A 1 B ■■■A"~'B\=n ( 2 ) 

(2) 式中的矩阵称为系统的可控制性矩阵.若 
( A ， S ) 是可控制的，则通过简单地选择一个适当的 
R " 中的控制序列，最多在 n 步内，该系统可以被 
控制或被驱动，从状态0去到任一指定的 （ R ” 中 
的）状态对这一点，习题18给出了在 
n = 4, m = 2 时的示例.对可控制性的进一步讨 
论，可参见本教材的网站（第4章的案例研究）. 
18.设 A 是 4 x 4 矩阵 ， S 是 4 x 2 矩阵， U0 , U „ U2 , U3 , U4 

是 R 2 中的输人向量序列. 

a . 设知= 0，用 （ 1 ) 式计算々 ，; c 2 ，; c 3 , &，用 
( 2 ) 式中的可控制矩阵 M 写一个计算; c 4 的 
公式.（注 意： 矩阵 M 用分块矩阵来构造 • 
此处它的大小是 4 x 8.) 

b . 设 （ A , B ) 是可控制的，^是]^中的任一向 
量，说明为何存在 R 2 中的一个控制序列 

，使得 x t =v . 


在19~22题中，判定矩阵对是否是可控制的. 




第 5 章特征值与特征向量 


介绍性实例 动力系统与斑点猫头觼 


1990年，在利用或滥用太平洋西北部大面积森林问题 
上，北方的斑点猫头鹰成为一个争论的 焦点. 环境保护学家 
试图说服联邦政府，如果采伐原始森林 （ 长有200年以上的 
树木）的行为得不到制止的话.猫头鹰将瀕临灭绝的危险 • 
因为猫头鹰喜好在那里居住.而木材行业却争辩说猫头鹰不 
应被划为“瀕临灭绝动物”，并引用一些已发表的科学报告来 
支持其 论点气 对木材行业来说，如果政府出台新的伐木限制 
的话，预计将失去30 000至100 000个工作岗位. 

数学生态学家们处于争论双方的中间，由于争论的双方 
都想游说数学家们，数学生态学家们加快了他们对斑点猫头 
鹰种群的动力学研究.猫头鹰的生命周期自然分为三个阶 
段： 幼年期 （1 岁以前）、半成年期（1~2岁）、成年期 （2 岁 
以后）.猫头鹰交配在半成年和成年期，开始生育繁殖，可 
活到20岁左右.每一对猫头鹰需要约1000公顷 (4 平方英里） 
的土地作为自己的栖息地.生命周期的关键期是当幼年猫头 



鹰离开巢的时候，为生存和进入半成年期，一只幼年猫头鹰必须成功地找到一个新的栖息地安家（通常 
还带有一个配偶）. 

研究种群动力学的第 I 步是建立以每年的种群量为区间的种群模型，时间为 A = 0,1,2,….通常可以假 
设在每一个生命阶段雄性和雌性的比例为1:1,而且只计算雌性猫头鹰，第 it 年的种群量可以用向量 
表示， 其中 A ，办和《»分别代表雌性猫头鹰在幼年期，半成年期和成年期的数量 


利用人口统计研究的实际现场数据， ltLambefson 及其同事设计了下面的“阶段矩阵模型 


(stage -1 


model) 


jk+l 


Sk+i 

= 

«* + i 



0 0 0.331 

0.18 0 0 
0 0.71 0.94 


"The Great 
R.H.Lambei 


November 1992， pp. 9I_ 
: .Voss, “A Dynamic Anal: 


Spotted Owl War”. （读者文摘》. 

:r8on, R.Mckelvey, B.R.Noon, and C.Voss, “A Dynamic Analysis of the Viability of the Northern Spotted Owl 

Fragmented Forest Environment", Conservation Biology 6( 1992), 505-512, 还可参见 Lamberson 教授的私人通信， 1993. 
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在这里新的幼年雌性猫头鹰在^ + 1年中的数量是成年雌性猫头鹰在^年里数量的 0.33 倍 （ 根据每一 
对猫头鹰的平均生殖率而定）•此外，18%的幼年雌性猫头鹰得以生存进人半成年期’ 71%的半成年雌性 
猫头鹰和94%的成年雌性猫头鹰生存下来被计为成年猫头鹰 

隨矩阵模型是形式为 jr,+, =私的差分方程，这种方程被称为动力系统（或离散线性动力系统）， 
因为它描述的是系统随时间推移的变化. 

Lamberson 阶段矩阵中，I 8 %的幼年猫头鹰生存率是受原始森林中猫头鹰数目影响最大的项目事实 
上，60%的幼年猫头鹰通常生存下来后就会离开自己的巢，但是在 Lamberson 和他的同事们作研究的加州 
的 Willow Creek 地区，只有30%的幼年猫鹰在弃巢后能找到新的栖息地，其他的在寻找新家园过程中失 
踪了. 

猫头鹰不能姻新栖息地的-个重要原因是因为对原始森林分散区域的砍伐而加剧了原始森林的分 
割_当猫头 贿开棘 缺 E 并穿过-块雜綱，觀食动物袭細鎌大增 . 5 . 6 雜会展示前面讨论 
的模型如何麵斑顏錢触终观，細#50%醜雜賊絲郝姻麵酿地，猫头鹰种群 
将会兴旺起来. 

»»»» 

本章的目的是剖析线性变换 jr 4 At 的作用，把它分解为容易理解的元素•除了 5.4 节，整 
章中出现’阵酿方阵.雌麵讨论的主要龍 Ji 織动力絲（錄姻醜点猫 头鹰） 
但有关特征獅槪向賴基本概念对赚学酿用鮮雛棚，它触糊背景要比我们 
麵考虑触广麟多._，雜值題赚職齡擁雛_动力雜，为工程设计 
提供关键知识，自然地，也出现在物理和化学等领 域里 . 

5.1 特征向量与特征值 

尽管变换有可能使向量往各个方向移动，但通常会有某些特殊向量 A 对这胜向 
量的作用是很简单的. U 

例1设 A = [; 0 2 j ，《= ⑺, v =[: j •图 5-1 显示秦乘以 A 后的图像 •事实 上，…正 

好是 2 v ，因此， A 仅仅是“拉伸”了 v . 



图 5-1 乘以 A 的作用 


㈣ 个例!1， 4 . 9 节_者应该_忆起，假如 A 是随机矩阵，那么 A _态向量 ？ 
俩足万程 > U : = jc ， 即 A 分=1.分. 
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这一节，我们将研究形如 / Uc = 2 jc 或 / Uc = -4 jc 的方程，并且去寻找那些被 A 变换成自身一 
个数量倍的向量. 


定义 A 为 nxn 矩阵， jc 为非零向量，若存在 数又使 /lx 成立，则称又为 A 的特征值， 

JC 称为对应于又的特征向量. 


容易验证给定的向量是否是矩阵的特征向量，也容易判断给出的数是否是特征值. 


例2设4 = 

解 


|， a = 和 v = , a _ 和 v 是否是 A 的特征向量? 



因此，《是特征值 -4 对应的特征向量，但 Av 不是 v 的倍数（见图5-2)，故 v 不是 A 的特 
征向量. 



例3证明7是例2中矩阵 A 的特征值，并求特征值7对应的特征向量. 

解 数7是 A 的特征值当且仅当方程 

Ax = 7 x ( 1 ) 

有非平凡解 ，（1) 等价于 / lx -7 x =0, 或 

( A -7 /)jc = 0 (2) 

为解该齐次方程，计算 



A -7/ 的列显然是线性相关的，故 （2) 有非平凡解，因此7是 A 的特征值.为求其对应的特征 
向量，用行变换化简 矩阵： 

[-6 6 0] 「1 -1 0 ] 

L 5 -5 oJ ~ l _0 0 0」 

故通解为凡是具有此种形式且 jc 2 *0 的向量都是又= 7对应的特征向量. ■ 
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瞥告虽然在例3中使用了行化简来求特征向量，但不能用行化简求特征值.矩阵 A 的 
阶梯形通常不显示出 A 的特征值. 


方程 （1) 和 （2) 的等价性对任何;1 = 7以外的入显然都是成立的.故; I 是4的特征值当且 
仅当方程 


( A - A/)jc = 0 (3) 

有非平凡解.方程 （3) 的所有解的集合就是矩阵4-又/的零空间.因此，该集合是 R " 的子空间， 
称为 A 的对应于; I 的特征空间.特征空间由零向量和所有对应于又的特征向量组成. 

从例3看出，例2矩阵 A 对应又= 7的特征空间由 （1,1) 的所有倍数 x 2 ( 1, 1 ) 组成，因此， 
特征空间是过 （ 1，1 ) 和原点的直线.在例2,也可以验证对应又= -4 的特征空间是经过 （6,-5) 
和原点的直线.图 5-3 显示了这些特征空间、特征向量 （1,1) 和 （3/2,-5/4) 及变换 I / lx 对 
每个特征空间的几何意义. 




"4 -1 6 


'2 0 0' 


"2 -1 6 

A -2/ = 

2 1 6 

2 -1 8 

- 

0 2 0 

0 0 2 

= 

2-16 

2 -1 6 


用行变换化简 (A-2/)jc = 0 的增广 矩阵: 


■2-16 O ' 


'2 -1 6 O ' 

2-160 


0 0 0 0 

.2-16 0. 


0 0 0 0 
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因为方程 ( A -2/) x =0 有自由变量，故2是 A 的特征值.通解是 

1/21 r -3 

= x 2 1 + JC 3 0 , X 2 和為为任意值 

0 J [ 1 

图 5-4 显示出特征空间是 R 3 的2维子空间，其中的一个基是 

in r -3 
2,0 
oj [ 1 





图 5-4 A 对特征空间的扩张作用 


数 值计算 的注解 在已知特征值的条件下，例 4 提供了手工计算特征向量的方法.虽然也 
可以利用矩阵程序和行化简来找出特征空间，但这不完全可靠.舍入误差有时会使简化的 
阶梯形矩阵出现锗误的主元素.如果矩阵不是很大，最好的计算机程序可按要求的精度同 
时算出特征值和特征向量的近似值.随着计算能力和软件的改善，能被分析的矩阵规模也 
逐年 增大. 

下列定理描述了特征值能被准确求出的几种特例之一.有关特征值的计算将在下一节讨论. 
定理1三角矩阵的主对角线的元素是其特征值. 

证为简单起见，考虑 3 x 3 的情形.假设 A 是上三角矩阵，那么 A - A / 是： 

On fli2 o>3 A 0 0 

k-Xl =0 022 O 23-0 A 0 
0 0 a 33 0 0 A 

a n _A a t2 a, 3 
= 0 022-A 023 

0 0 fl 33 —A 

数 A 是 A 的特征值当且仅当方程 ( A - A/)x = 0 有非平凡解，即方程有自由变量.由 A - A / 容 
易看出， （ A - A/)x = 0 有自由变量当且仅当 A - A / 的对角线上的元素至少有一个为零，而当;131 
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a u , a 22 , 吻之一的时候出现这种情况•故4的特征值是如，％ ，办 .若4是下三角矩阵，见习题 28. 

■ 

"3 6 -81 「4 0 0— 

例5设0 0 6 , B = -2 1 0 , A 的特征值是3,0和 2.fi 的特征值是4和 1. ■ 

0 0 2 ] [_ 5 3 4_ 

例5中的矩阵 A 有零特征值，因此方程 

Ax = Ox ( 4 ) 

有非平凡解.但（ 4 )等价于 Ac = 0, 而 Ac = 0 有非平凡解的充要条件是4是不可逆的.因此，4 
有零特征值的充要条件是 A 为不可逆_由此，0是4的特征值当且仅当4为不可逆.这一事实 
添加到 5.2 节的可逆矩阵定理中. 

接下来的定理很重要，以后将会用到.定理的证明展示了特征向量的典型计算. 

定理2人，…又是 nxn 矩阵/4相异的特征值， v ! ，…， v r 是与人，…又对应的特征向量，那么 
向量集合 { v , ，…, vj 线性无关 • 

证用反证法.假如 { Vl ，…, V r } 线性相关，那么存在最小的下标;7,使得 V p +1 是前面向量（这 
些向量线性无关）的线性组合，即存在数^，…,，使得 

CiV t +--- + c p v p = v p ^ (5) 

式 （5) 两边乘 A ，并将 Av * = A * v *(( = 1,...，;? + 1)代人，得 
CiAvi + ■■■ + c p Av p = Av „^ 

c i^ v i—.. + c pAp〜=A P+ i»Vi (6) 

式 （5) 两边乘 A p +1 ， 并与式 （6) 相减，得 

ci(^ -A p+ i)vi +---+Cp(A p -A P+ i)v p =0 ( 7 ) 

因为 { v , ，…， v p } 线性无关，式 （7) 的系数全 为零. 但入 -A p+1 ，…， A p -A p+1 全不为零，因此只有 
c ,=0 ;1 = 1,..., p . 由式(5)得》； ；1+1 =0，矛盾.故{ 1 ；,，...，广}必是线性无关的. ■ 

特征向 置与差 分方程 

我们通过构造一阶差分方程 

x„ + i = Ax k (k = 0 , 1 , 2 ,-) (8) 

的解来结束本节. 

若 A 是矩阵，那么方程 （8) 是 R ” 的序列 { x *} 的递归 表示. 方程 （8) 的解是描述序列 
{ x *} 的每个 x * 的显式公式，公式不直接依赖于4和序列前面的项，而是依赖于初始项 x 。. 

构造方程 （8) 的解的最简单方法是取4的一个特征向量 x 。 和它对应的特征值 X ,然后令 
x * = A * x 0 ( A : = 1,2,…） (9) 

这就是方程 （8) 的解，因为 

Ar * = A ( A * x 0 ) = A *( Ar 0 ) = A *( Ax 0 ) = A * +1 x 0 = x i+1 
此外，形如 （9) 的解的线性组合仍然是 （9) 的解，见习题 33. 
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练习题 


6 -3 1 
3 0 5 

2 2 6 


5是/!的特征值吗? 


2 . _若1 是 A 对应于 A 的特征向量，求 A 3 x . 

习题 5.1 

1. A = 2*^ 的特征值吗？为什么？ 

2. 几=-2是|^ 的特征值吗？为什么？ 

3. 的特征向量吗？如果是，求对应 


的特征值. 

[-1 + V 21 




是 J 的特征向量吗？如果是，求 

L 1 」 Li 

对应的特征值. 

7 9 1 

的特征向量吗？如果是， 



■4 


' 3 7 9' 

5 

-3 

1 

是 

-4 -5 1 

2 4 4 


求对应的特征值. 


7. 又= 4是 


3 0 


的特征值吗？如果是，求入 


l -3 4 
对应的一个特征向量. 

2 2 ] 


A = 3 是 


-2 


的特征值吗？如果是，求入 


对应的一个特征向量. 

在习题9~16中，求所给特征值对应的特征空 
间的一个基. 


9. A 


"5 0" 
~ 2 1 


X = 1,: 


10 . 4 = 

11. A = 

12. A = 


1' 

-2 

是 

.3 6 7， 

3 3 7 

的特征向量吗？如果是，求对 

1 


5 6 5 

16. A = 

应的特征值. 



10-9 


,A = 4 


，又 =1 


4 -2 
4 -2 
-3 9 

7 4 

-3 -1_ 

4 0 1' 
-2 1 0 
-2 0 1 
1 0 


4-13 1 

4 2 3 

—11-3 
2 4 9 

3 0 2 0 l 


A = 1,5 


,A = 1,2,3 


，又 =: 


18. 


求习题 17 和习题 18 中矩阵的特征值. 
「0 0 01 
0 2 5 

0 0-1 
4 0 0 

0 0 0 
1 0-3 


19. 不用计算，求1 
证你的结果. 


的一个特征值，验 
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'5 5 5" 

20. 不用计算，求/!= 5 5 5的一个特征值和两 

5 5 5 

个线性无关的特征向量，验证你的结果. 
在习题21和习题22中，是 nxn 矩阵.标出 
毎个命题的真假，给出理由. 

21. a . 若对某个向量 jc 有 Ac = Ajc ， 则 A 是 A 的特 

征值. 

b . 矩阵 A 不可逆的充要条件是零是 A 的特征 
值. 

C. 数£：是/1的特征值的充要条件是 
( A-cOx = »有非平凡解. 

d . 求 A 的特征向量可能是困难的，但验证一 
个给定的向量是否是特征向量却是容易 
的. 

e . 为求 A 的特征值，可将 A 化简为阶梯形矩 
阵. 

22. a . 若存在数 A 使 Ax = hc 成立，那么 x 是 A 的 

特征向量. 

b . 若》>,和》> 2 是线性无关的特征向量，则它们 
是对应于不同特征值的特征向量. 

c . 随机矩阵的稳态向量就是其特征向量. 

d . 矩阵的特征值是在其主对角线上的元素. 

e . 矩阵 A 的特征空间是某矩阵的零空间. 

23. 为什么 2 x 2 矩阵最多只能有2个相异的特征 
值？为什么 nxn 矩阵最多只能有„个相异的 
特征值？ 

24. 举一个只有一个特征值的 2 x 2 矩阵的例子. 

25. 设 A 是可逆矩阵 A 的特征值，证明 A — 1 是 / T 1 的 
特征值.（提 示： 假设非零向量 x 满足 
A * = Ax .) 

26. 证明： 若 f 是零矩阵，则 A 只有零特征值. 

27. 证明： A 是矩阵 A 的特征值当且仅当 

的特征值.（提示 ：找出 A - A / 和 / T - A / 的关 
系，然后证明可逆的充要条件是 
A T -XI 是可逆的 .） 


28. 若是下三角矩阵，利用习题27来证明定理 1. 

29. 设 nxn 矩阵 A 的毎行元素之和都等于 s ，证明 
i 是 A 的特征值.（提 示： 找一个特征向量 .） 

30. 设 nxn 矩阵 A 的毎列元素之和都等于 i ,证明 
i 是 A 的特征值.（提 示：利 用习题27和 29.) 
在习题31和习题32中，设 A 是线性变换 T 的 

矩阵，不写出求 A 的特征值和特征空间. 

31. 设 T 是 R 2 的相对过原点的某条直线的反射变 
换. 

32. 设 r 是 R 3 的相对过原点的某条直线的旋转变 
换. 

33. 设《和 v 是矩阵 A 的特征值 A 和//对应的特 
征向量， C ，和是数，定义 

x * = c x X k u + c 2 fi k v (Jfe = 0,1,2, •••) 

a. 根据定义求 

b . 用 a 的公式计算/^，并验证= jc j+1 . 
这就证明了上面定义的序列满足差分 
方程 x M = Ax„(k = 0,1,2,-). 

34. 如果给出的初始向量 jc 。 不是 A 的特征向量， 
你是否能找出解差分方程 x » +1 = At*(Jfe = 0， l , 
2,…)的方法？（提 示： 能否把 jc 。 与 A 的特征 
向量相联系？） 

35. 设《和 v 是下图中的向量，并设《和 v 是一个 
2 x 2 矩阵的分别对应于特征值2和3的特征 
向量.并设 r : R 2 ^ R 2 是线性变换，对 R 2 中 
的毎一 X 有 r ( x ) = Ac ,记 》» = a + v . 在下图 
中，仔细画出向量 r («), r ( v ) 和 r (» o . 

L 


36. 设 《* v 是一个 2 x 2 矩阵 A 分别对应特征值为 
-1 和3的特征向量，重做35题. 

[ M ] 在习题37~40中，利用矩阵程序求矩阵的 
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特征值.然后用例4的行化简方法找出每一特征空 


38. 


间的基. 

8 -10 
2 17 

-9 -18 

9 一 4 -2 -4 

I -56 32 -28 44 

| -14 -14 6 -14 

42 -33 21 -45 


'6 -3 r 


■5 0 0. 


1 -3 r 

3 0 5 

- 

0 5 0 

= 

3-5 5 

2 2 6 


0 0 5 


2 2 1 


练习题答案 

1. 5是>1的特征值的充要条件是方程 = 0 有非平 凡解. 计算 


将增广矩阵行 化简: 


显然，齐次方程组无自由变量，故 4-5/ 是可逆矩阵，即5不是 A 的特征值_ 
2. 如果 x 是>1对应 A 的特征向量，则有 Ac = Ax， 故 = A(Ax) = AAr = A 2 x . 
同理， 4 3 x = >104 2 x ) = >KA 2 x ) = AMjc = A 3 x . 对一般的 it ，有 = 


1-3 10" 


1-3 1 0] 


1-3 1 0" 

3-550 


0 4 2 0 


0 4 2 0 

2 2 1 0_ 


0 8-10 


0 0-5 0 


5.2 特征方程 

方阵 A 的特征方程是一个数量方程，其中包含了有关特征值的有用信息.我们先从一个简 
单的例子开始，然后讨论一般情形. 

例 1求的特征值_ 

解 我们必须找出所有这样的数 A ,使得矩阵方程 

( A - A/)jc = 0 

有非平凡解.由逆矩阵定理，这个问题等价于要求出所有的 A ，使得矩阵々_ A / 为不可逆矩阵，这里 

— 口口 IT A 

由 2.4 节的定理4,该矩阵当它的行列式值为零时是不可逆的.因此 A 的特征值是下列方程的解 

_2 -又 3 ] = 0 

-6-A 


det(A-A/) = det 


2 l4l0 4 n 2 1 2 5 
87c^o^ 

Jos? - 720 - 46 - 18 - 37 ^ 0 

- 9 - 9 23- 13 - 412 47 12 
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我们知道 


故 



det ( A - AZ ) = (2 - A )(-6 - A ) - (3)(3) 
= —12+6 A —2 A + A 2 —9 
= A 2 +4 A -21 


令 A 2 +4 A -21 = 0, 有 ( A -3 )(A + 7) = 0, 故 A 的特征值是3和 -7. ■ 

例1的行列式把包含2个未知数 （ A 和 x ) 的矩阵方程 ( A - A/)x = 0 转化为只含一个未知数 
的数值方程 A 2 +4 A -21 = 0, 这种思想对》><»矩阵仍然适用.但在讨论更大的矩阵之前，我们先 
给出研究特征值要用到的行列式的性质. 


行列式 


设矩阵，是对 A 作行替换和行交换（不作行倍乘）所得到的任一阶梯形矩阵， 
r 是行交换的次数，那么 A 的行列式 deM = (-1)4, 如果 A 可逆，那么 Kl ，，…，‘都是主元. 


否则，至 少有、 为零，从而乘积叫…、为零.因此 0 
' -1) 当 A 可逆 


det A = • 

"l 5 O ' 

例 2 计算 A = 2 4-1 的行列式 detA . 

0-2 0 

解下面的行化简使用了一次行 交换： 


当 A 不可逆 


'1 5 O ' 


■1 5 O ' 


■1 5 0" 

0-6-1 


0-2 0 


0-2 0 

0 -2 0 


0-6-1 


0 0-1 


=U X 


故下面选择的行化简没有用到行交换，得到了另一个不同的阶梯形 
矩阵.最后一步是用 -1/3 乘第2行加到第3行上： 



~1 5 

O ' 


"l 

5 

0" 

A ~| 

0-6 

-1 

~ 

0 

-6 

-1 


0 -2 

0 


0 

0 

1/3 


=U 2 


此时 ， detA = (- l )°( l )(-6)( l /3) = -2, 与前面的计算结果相同. ■ 

计算行列式的公式 （ 1 ) 说明 A 是可逆的当且仅当 det A 非零.这个事实以及 5.1 节中例5后 
面的可逆性的性质，可以添加到可逆矩阵定理当中. 


© 公式 （1) 在 3.2 节导出，没有读过第3章的读者可能会把该公式当作行列式 det/l 的定义.值得注意的是，对4作 
变换 （ 不作倍乘变换）所得到的任一阶梯形矩阵£/的行列式值就是 detA. 
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定理 （可逆矩阵定理（续 ）） 

设 A 是 nxn 矩阵，则 A 是可逆的当且仅当 

s . O 不是 A 的特征值. 

t . 力的行列式不等于零. 

如果 A 是 3 x 3 矩阵，那么 \ dctA \ 是由>1的列向量生成的平行六面体的体积，见图 5-5 
(细节见 3.3 节）.平行六面体的体积不等于零当且仅当向量线性无关，即矩阵4是可逆 
的 . < 如果向董非零且线性相关，它们位于同一个平面或一条直线上 .） 



图 5-5 


定理3列出了由 3.1 节和 3.2 节导出的结论，这里将 （ a ) 也包含进来以便参考. 

定理 3 (行列式的性质） 

设欠和是 nxn 矩阵. 

a . A 可逆的充要条件是 detA 尹 0. 

b . deti 4 B = ( deM )( detfl ). 

c . detA T = det A . 

d . 若 A 是三角形矩阵，那么 detA 是 A 主对角线元素的乘积. 

e . 对 /V 作行替换不改变其行列式值.作一次行交换使其行列式值符号改变一次.数乘一行 
后，行列式值等于用此数乘原来的行列式值. 

特征方程 


利用定理 3 U )， 我们可以通过行列式来判断矩阵 A - A / 是否可逆.数值方程 det (/\- A /) = 0 
称为 A 的特征方程，例1验证了以下结论. 



解写出 A - A / 并利用定理3 ( d ): 
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~ 5 -X 

det ( A - A /) = det ^ 

0 


-2 

3 -A 

0 

0 


6 

-8 

5 -A 

0 


特征方程是 
或 

展开乘积，特征方程也可以写为 


= (5- A )(3- A )(5- A )( l - A ) 
(5- A ) 2 (3- A )( l - A ) = 0 
( A -5) 2 ( A -3)( A -1) = 0 


0 

4 

1 -A 


A 4 -14 A 3 +68 A 2 -130 A +75 = 0 ■ 

例 1 和例 3 的 det ( A -； l /) 是关于 A 的多项式.可以看出，如果 A 是矩阵，那么 det ( A -； l /) 
是《次多项式，称为 A 的特 征多 项式. 

在例 3 中，由于因子 (又-5) 在特征多项式中出现了 2 次，故称特征值 5 有重数 2. — 般地， 
把特征值 A 作为特征方程根的重数称为是 A 的 （代数）重数. 

例4某 6 x 6 矩阵的特征多项式是 A 6 -4 A 5 -12 A 4 ，求特征值及重数. 

解 把多项式分解因式 

A 6 - 4 A 5 - 1 2 A 4 = A 4 ( A 2 -4 A - 1 2) = A 4 (A - 6 )(A + 2) 

特征值是0 ( 重数为 4), 6 ( 重数为1 ) 和 -2 ( 重数为1 ) . ■ 

我们同样可以说例4所给矩阵的特征值是0, 0, 0, 0, 6和-2,特征值按其重数重复计数. 

因为 《 x « 矩阵的特征方程包含有一个„次多项式，如果算上重根，并允许有复根，则特征 
方程恰 好有” 个根.复根称 为复特征值， 将在 5.5 节讨 论之. 目前，我们只考虑实特征值. 

特征方程具有十分重要的理论意义.但在实际计算时，任何大于 2 x 2 矩阵的特征值应该用 
计算机去求，除非矩阵是三角形或有其他特殊 性质. 虽然 3 x 3 矩阵的特征多项式容易用手工算 
出，但对其因式分解却不是容易的事（除非是精心选择的矩 阵）. 见本节末的数值计算注解. 
相似性 


下列定理说明了特征多项式的一个用途，并为某些近似计算特征值的迭代方法提供理论基 
础.假如 A 和 S 是” x « 矩阵，如果存在可逆矩阵/>，使得厂，从= 6,或等价则 
称4相似于记卜广 1 ，则有 d (2 = A ， 即 S 也相似于故我们简单说 A 和 S 是相似的. 
把4变成的变换称为相似 变换. 


定理4若《乂”矩阵泌和6是相似的，那么它们有相同的特征多项式，从而有相同的特征 
值（和相同的重 数）. 

证由4与 S 相似，有那么 

fi — 又/ = P ' AP - XP-'P = P -\ AP - XP ) = P ' ( A - XI)P 
利用定理 3 的性质 （b ), 有 
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det(e - A /) = det [尸 _1 (A _ A /) 尸] 

= det (戶 _1 ). det ( A - A /)- det (尸） 

W 为 det(P ')- det ( P ) = det ( P *' P ) = det / = 1 ，由 （ 2 ) 得 det(e - A /) = det ( A - A /) 

警告相似性与行等价不是一回事.（假如 A 行等价于 S ， 则存在可逆矩阵£，使得 
B = EA ) 对矩阵作行变换通常会改变矩阵的特征值. 

应用到动力系统 

如本章引例中提到的，特征值与特征向量是我们剖析动力系统的离散演变的关键点. 


2 ) 

■ 


例5设，分析由1* + 1=如*(灸=0，1，2，...)，0：。=|二|所确定的动力系统的长 


「0.61 
： 0.4 


期发展趋势. 

解第1步求 A 的特征值，并找出每个特征空间的基. A 的特征方程是 
「0.95-又 0.03 1 

0 = det 

[ 0.05 0.97 -Aj 

= A 2 -1.92 A + 0.92 
由二次方程的求根公式 


^ (0.95 - A )(0.97- A )-(0.03)(0.05) 


X - 


1 . 92 + V ( 1 . 92) 2 — 4 ( 0 . 92 ) 一 1 . 92 土 75 ^ 5 ^ 


：1 或 0.92 


容易验证对应；1 = 1和又= 0.9 2 的特征向量分别是 v , 和 v 2 = J _| J 的倍数. 

S { Vi，V 

[:] 


下一步把给定的 X 。表示为 v ,* v 2 的线性组合，显然{^ 2 }是 R 2 的基，因此存在系数 C , 和 
,使得 


Xo = c , v ,+ c 2 v 2 =[ v , v 2 ] 


_c：] = [V ' V2] 、=[ 5 3 —[1 


w 为，式 


「3 ir|0.60| 

‘ 5 - 1 」 [ 0.40 i 
- 丄 I- 1 -Mr0.60lj0.125l 

-8 [-5 3」 [0.40] [0.225J 

的”41卜 2 是4的特征向虽，故容易算出每个 & 

=Ax« =f,/4v, + c 2 Av 2 利用 ; that 的线性性质 

= fiVi + c 2 (0.92) v 2 v,*v 2 是特征向量 

x 2 = Ax\ =c,Av, + c 2 ( 0 . 92 ) Av 2 
^ CiV , +r：(0.92) 2 v 2 
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继续下去，有 

x k = c , v , + c 2 (0.92)* v 2 ( A : = 0,1，2,…） 

把式 （4) 的 c , 和0 2 代入上式，得 

x * = 0. 125 [;] + 0.225(0.92)*[_;] (it = 0,1,2,-) (5) 

x * 的显式公式 （ 5 ) 就是差分方程 x t+1 = 的解. 

当 A : moo 时， (0.92)* -^0, x t °' 375 =0.125 v ,. ■ 

[0.625 J 

把例5的计算结果应用于 4.9 节的马尔可夫链很有意思.读过 4.9 节的读者可能注意到上面例5 
的矩阵 A 就是 4.9 节的移民矩阵 M ， ： c 。 是城市和郊区的初始人口分布， h 表示 A : 年后的人口分布. 

4.9 节的定理18说明，对于 A 这样的矩阵，序列 X * 趋向于一个稳态向量.现在我们知道了 
原因所在，至少对移民矩阵是成立的.这里稳态向量是 0.125 V ,， 是特征向量 v , 的倍数，计算 a 的 
公式 （5) 正好显示了为什么〜 40.125 V ,. 

数值计算的注解 

1. 像 Mathematica 和 Maple 这样的计算机软件能利用符号计算求出一个中等规模 
矩阵的特征多项式.但对于的一般矩阵，没有公式或有限算法来求解其特征 
方程. 

2. 最佳的求特征值的数值方法完全避开特征多项式.事实上， MATLAB 通过先求 
出矩阵 A 的特征值;^，…，弋，然后通过展开 (又 的积来得到 A 的特 
征多项式. 

3. 有几个基于定理4的估计矩阵 A 特征值的常用算法.非常有效的 (2/? 算法将在习 
题中讨论.当 A = A T 时，可使用称为雅可比的另一种方法来计算形如 

斗=泌和八 +1 =/»*-%只 （fc = l ，2, …） 

的矩阵序列.序列中的每个矩阵都相似于 A ， 因此有与 A 相同的特征值.当 A : 增大时， 

A +, 的非对角线元素趋于零，而主对角线上的元素近似于 A 的特征值. 

4. 其他估计特征值的方法在 5.8 节讨论. 

练习题 

求 4 = D 的特征方程和特征值. 

习题 5.2 


求习题1~8矩阵的特征多项式和特征值. 
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习题 9-14 要用到 3.1 节的方法.利用余子式 
展开或在 3.1 节习题 15 ~ 18 前给出的 3 x 3 行列式的 
特殊公式求矩阵的特征多项式 .（ 提示： 只用行变换 
求 3 x 3 矩阵的特征多项式不简便，因为涉及变量又.） 


I 6 0 

4 0 0" 

5 3 2 
-2 0 2 


6-2 0 
-2 9 0 


0 2 


1 2 0 
"-1 0 
-3 4 
0 0 
"5 -2 
0 1 
6 7 


写出习题15〜17中矩阵的特征值，特征值按其 
重数重复写出. 


~4 -7 0 2 

0 3-46 

0 0 3 -8 

0 0 0 1 ^ 

3 0 0 0 0" 

-5 10 0 0 

3 8 0 0 0 


5 0 0 0 

8 4 0 0 


[-4 1 9 -2 

18. 能够证明特征值 A 的代数重数大于或等于其特 
征空间的维数.求下面矩阵4中的/*，使 
的特征空间是2维的. 

'5 -2 6 
0 3办 0| 

A= 0 0 5 

0 0 0 


在习题21和习题22中， A 和 fl 是 nxn 矩阵， 
判断每一命题的真假，并验证答案. 

21. a . A 的行列式值等于其对角线上元素的乘积 • 

b . 对作初等行变换不会改变 A 的行列式值. 

c . (det A )( detB ) = det A 5 . 

d . 若; 1 + 5 是 A 的特征多项式的因子，则5是 
A 的特征值. 

22. a . A 为 3 x 3 矩阵，其列为，则 deM 等 

于由 a ,, a 2 , a 3 生成的平行六面体的体积. 

b . detA T =(- l ) detA . 

c . A 的特征方程的根 r 的重数称为特征值 r 
的代数重数. 

d . 对作行替换不会改变其特征值. 

一个广泛用来估计一般矩阵4的特征值的方 

法是 G /? 算法.在适当的条件下，该算法产生一个 
矩阵序列，序列中的矩阵全部相似于4，矩阵几乎 
是上三角的，并且主对角线上的元素近似于 A 的特 
征值.主要思想是把4 (或另一个相似于 A 的矩 
阵）分解为这里21=2^，而尺是上三 
角矩阵.将 G ; 与 心交换 后形成4 = ^2,，4又被 
分解为 A = G 2 尽，然后令戌=尽&，一直做下去. 
由习题23的结论知，44,…是相似的. 

23. 证明，假如/1 = 2尺， G 可逆，则4相似于 
\= RQ . 

24. 证明，若 A 和 fl 相似，贝 ijdet/l = detfl . 

—[：：： (眺 

4是 4.9 节例5中研究的随机矩阵）. 

a . 求 R 2 的一个基，基由》>，和 A 的另一个特征 


19. 设4是 nxn 矩阵，并假设4有 n 个实特征值 

，…,特征值按其重数重复，因此 
det ( i 4 — XI ) = (Ai — A)(^2 —又)… ( A * — 儿） 

请解释为什么 detC^zA .l …尤 （此结果对有 
复特征值的方阵仍然成立）. 

20. 利用行列式的性质证明4和 / T 有相同的特征 
多项式. 


向量组成. 

b . 证明 x 。 可以写成 Xfh+cvr 

c . 定义心=/1\。，灸=1，2,...，证明当*增大时， 

ATi -^V,. 

26. 设 A = t 用本节给出的计算行列式的公 

式 （1) 证明 deM = arf - 办 c ， 考虑 a 矣0和 a = 0 
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两种情况. 


27. WA = 

0.5 0.2 0.3’ 

0.3 0.8 0.3 

， V| = 

0.3' 

0.6 

4;1 


0.2 0 0.4 


0.1 

U— 


a . 证明 v ,， v 2 , v 3 是 A 的特征向量.（注意： A 是 
4.9 节例3中的随机矩阵 .） 

b . 设 X 。是 R 3 中的任一向量，其所有分量非 
负，且分量和为1 ( 在 4.9 节， x 。 被称为概 
率向量）.解释为什么存在常数〜^,^使 
得 X 。 = c , v , +c 2 v 2 +c 3 v,. 计算 w T x 0 ，并推断 

Cl = 1. 

C . 对 （ b > 中的 X 。，定义 A =/ x»，/t = l ,2，...， 证 
明当/ I 增大时， 

28 . [ M ] 构 造一个 随机的 4 x 4 整数值矩阵 A ,并验 
证4和 / T 有相同的特征多项式（相同的特征 
值和相同的特征值重数）. A 和 / T 有相同的 
特征向量吗？对 5 x 5 矩阵作同样的分析，写出 

练习题答案 


矩阵和计算结果. 

29. [ M ] 构造一个随机 4 x 4 整数值矩阵 A . 

a - 不用倍乘将 A 化简为阶梯形矩阵 f / ，用（例 
2 前的 ）（ 1 ) 式中的£/计算 detA. (假如 A 
是奇异的，重新构造一个随机矩阵再做 .） 

b . 计算 A 的特征值和特征值的乘积（尽可能 
精确）. 

c . 写出矩阵/!，精确 到二位 小数，写出£/的 
主元和 A 的特征值,用矩阵程序计算 detA, 
并将结果与 （a >和 （b ) 得到的乘积进行 
比较. 

■-6 28 2厂 

30. [ M ] 设/!= 4 -15 -12 ,对 a 取集合{32， 

- 8 a 25 J 

31.9,31.8, 32.1, 32.2} 中的每一个值，计算4的 
特征多项式和特征值，并画出相应的特征多项 
式 pW = detC 4- ; /) 在0彡，<3的图.有可能的 
话，在同一个坐标系中画出所有的图形，能否 
从图中看出特征值怎样随的变化而变化？ 


特征方程是 


解方程.求得 


0 = det ( A - A /) =det 


1-A 

4 



=(1 -又） (2- A )- M ) 沖=又 2 -3；1 + 18 


很明显，特征方程没有实数解， 
成立. 


j _ 3 + V(-3) 2 -4(18) 3±V^63 
2 2 ~ 

故没有实的特征值.这样就不存在 R 2 的非零向量 v 和实数; I 使得 Av =如 


5.3 对角化 


在巧多舰下，从分解 = '，我们能够了觸有关矩阵 A _征值和特征向量的 

fH 息.本节，我们麵分解式 在嫌大 时能快速计算/， 这是紐 代数中某些应腦基本思想 
稍后，在 5.6 和5_ 7 节，分解式被用来分析（解耦）动力系统. 
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例 1若 


分解式中的 Z ) 代表对角矩阵，很容易计算出 D 的幂. 

5 2 0 _ 

0 3 2 

p 0] r 5 2 0 

0 3 0 3 2 I I 0 3 3 


=[ 5 °]，贝以=「 5 ° [ 5 °1斗: 

0 3 」， 1_0 3 」 L 0 3 」 


D 1 = DD 2 


' = [ 5 3 0 

2 J = [ 0 3 3 


-般有 


5* 0 I 

.0 3*J 

^A = PDP \ 其中 P 为可逆矩阵， Z > 为对角矩阵，那么 /的计 算也很简单，见下例. 

_ ;] ，给定 其中 4 d = [ K ] 

解 由 2x2 矩阵的逆矩阵的标准公式得 

' 2 11 


例2设 A = 


对 it 彡 1, 


计算 


尸 1 : 


然后，结合矩阵乘法，得 

A 2 = ( PDP -' XPDP 1 ) = PD(P ' P ) DP ~' = PDDP -' 
'_ w - . 


: PD 2 P - 


A 3 = ( PDP ') A 2 = ( PDP ') PD 2 P -' = PDD 2 P ' = PD } P ' 


同理， 


-般对有 


A k = PD k P ' 


1] 「 5* 0 ' 
2」 0 3* — 


__ -2 

= |" 2.5*-3* 5*-3* 1 ■ 

- l_2.3*-2.5* 2.3*-5* J 

如果方阵 A 相似于对角矩阵，即存在可逆矩阵和对角矩阵 D ，^A = PDP ', 则称 A 可 
对角化•下一个定理给出了可对角化矩阵的特征，并告诉我们如何去建立合适的分解式. 


定理 5 (对角化定理） 

矩阵 A 可对角化的充分必要条件是 A 有 n 个线性无关的特征向量. 

事实上， A = PDP ', Z > 为对角矩阵的充分必要条件是的列向量是泌的”个线性无关的 
特征向量.此时， D 的主对角线上的元素分别是 A 的对应于中特征向量的特征值 • 

换句话说， A 可对角化的充分必要条件是有足够的特征向量形成] r 的基，我们称这样的基 
为特征向置基. 
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证 首先看到，若 P 是列为 v , ，…， v „ 的任一 《 x « 矩阵， Z > 是对角线元素为不，… 人的 对角矩 
阵，那么 

AP = A [ v , v 2 … v „] = [ Av , Av 2 ••- Av „] (1) 

而 


PD = P 


A , 0 

0 h 


: LVi ^zv 2 ••- Kv„] 


0 0 … 1 

现假设 A 可对角化且，用尸右乘等式两边， 则有从 =叩•此时，由 （1) 和 （2) 得 
[ Av , Av 2 … Av „] = [ A , v , liV 2 ••- A„vJ (3) 

由列相等，有 


Av, =A,v,, Av 2 =X 1 v 2 ,---,Av n =Kv n (4) 

因为/ > 可逆，故/>的列 v , ，…，匕必定线性无关.同样，因为这些^，…, v „ 非零， （4) 表示;，…，1 
是特征值， V, ， … ， v„ 是相应的特征向量.这就证明了定理中第一，第二和随后的第三个命题的必 
要性. 

最后，给定任 意”个 特征向量1^，…， v „, 用它们作为矩阵的列，并用相应的特征值来构造 
矩阵0，由（1)~(3)，等式 AP = PD 成立而不需要特征向量有任何条件.若特征向量是线性无 
关的， 则戶是 可逆的（由可逆矩阵定理），由泌尸=/^可推出 ■ 


矩阵的对角化 


例3 可能的话，将下面矩阵对角化 

'13 3" 

A = -3 -5 -3 
3 3 1 

即求可逆矩阵 P 和对角矩阵 Z > ，使得 AtPZV - 1 . 

解对角化工作可分为 4 步来完成. 

第1步求出4 的 特征值 •在 5.2 节曾提到，在矩阵的规模大于 2 x 2 时，可借用计算机求特 
征值，为避免分心，本书将会提供这一步的内容.现在的特征方程是一个3次多项式，可分 解为： 
0 = det ( A - A /) = - A 3 -3 A 2 +4 
= -( A - l)(A + 2) 2 

特征值是又=1和又= -2. 

第2 步 求4 的 3个线性无关 的特征 向置. 因为 A 是 3 x 3 的，故需要 3 个向量.这一步很 
关键，如果找不到这 3 个向量，那么由定理 5, A 就不能对角化.用 5.1 节的方法可求出每一特 
征空间 的基： 

对于;1 = 1的 基是： v ,= f - l ] 
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-r 


-1" 

对于;1 = -2的基 是： v 2 = 

1 

0 

和 v 3 = 

0 

1 


你可以验证 { v ,， v 2 ， v 3 } 是线性无关的 • 

第 3 步用第 2 步得到的向置构造矩阵 P . 向量的次序不重要，用第2步选择的次序，形成 

' 1 -1 - 1 ' 
p=[v, v 2 V 3 ]= -1 1 0 

10 1 

第 4 步用对应的特征值构造矩阵 D . 构造 Z > 时，特征值的次序必须和矩阵 P 选择的特征 
向量的次序一致.对应;1 = -2的特征向量有2个，特征值 A = -2 要出现2 次： 

'1 0 0 " 

D = 0 -2 0 

0 0 - 2 . 

验证所找的/>和1>是否正确是一个好的习惯，为避免计算/- 1 ,可简单验证 AP = PD ， 这 
等价于当 P 可逆时(但必须确认 P 是可逆的！）我们计算 


AP = 

'1 3 3 - 

—3—5-3 


1 -1 -l 

-1 1 0 

= 

"12 2' 

-1-2 0 


3 3 1 


10 1 


1 0-2 



1 - 1 -1" 

"l 0 0" 


"12 2" 

PD = \ 

-1 1 0 

0-2 0 

=i 

—1 -2 0 


10 1 

0 0-2」 


1 0-2 


例4可能的话，将下面的矩阵 A 对角 化： 

' 2 4 3' 

A = -4 -6 -3 
3 3 1_ 

解 A 的特征方程与例3的完全 一样： 

0 = det ( A - A /) = - A 3 -3 A 2 +4 = -( A - l)(A + 2) 2 
特征值是; 1 = 1 和 ; l = -2. 但当我们找特征向量时，发现每一特征空间仅是一维的. 

对于;1 = 1的特征 向量： v ,= 

对于;1 = -2的特征 向量： v 2 = 

没有其他的特征向量了， A 的每个特征向 量都是 〜或卜的倍数.因此不可能利用 A 的特征向量 
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来构造出 R 3 的基.由定理5 ， A 不能对角化 • 

以下定理为矩阵可对角化提供了充分条件. 


定理 6有 n 个相异特征值的 nxrt 矩阵可对角化 • 

证设 V ,，…, v „ 是矩阵 A 对应于 n 个相异特征值的特征向量，由 5.1 节定理2, { V ,，…, v „} 是 
线性无关的，因此，由定理5, A 可对 角化. ■ 

不过，矩阵并不需要有《个相异特征值才可对角化.例3的 3 x 3 矩阵尽管只有2个相 
异的特征值，但它是可对角化的. 

例 5 确定下列矩阵能否对 角化： 

■5-8 1' 

0 0 7 

0 0 -2 

解很容易判断矩阵 A 可对角化.因为 A 是三角矩阵，其特征值显然是5, 0和-2,有三个 
相异的特征值，故 A 可对角化. ■ 

特征值不是都相异的矩阵 

如果 rtXrt 矩阵 A 有《个相异的特征值及相应的特征向量 V ,，…， v „ ，如果记 Pztv , … v „], 
那么由定理2， P 的列是线性无关的，自然/>是可逆的.当 A 可对角化，但 A 相异的特征值的 
个数少于《时，我们仍可以用以下定理给出的方法来构造可逆矩阵/ 

定理 7设 A 是矩阵，其相异的特征值是;^...，心. 

a . 对于 1彡*彡 的特征空间的维数小于或等于 1 的代数重数. 

b . 矩阵 A 可对角化的充分必要条件是所有不同特征空间的维数之和为《 .即每个 A 的特 
征空间的维数等于; U 的代数重数. 

c . 若 A 可对角化，氏是对应于; U 的特征空间的基，那么，集合岛，…，氏中所有向量的集 
合是 R " 的特征向量基. 

例6可能的话，将下列矩阵对角化. 

'5 0 0 0' 

^ 0 5 0 0 

A ~ 

14-30 
-1-2 0-3 

解 A 是三角矩阵，特征值是;1 = 5和;1 = -3,重数都是 2. 利用 5.1 节的方法，我们求出每 
个特征空间的基. 


© 定理7的证明有点长但不难，可看 S.Friedberg, A. Insel, andL.Spence ，Linear Algebra , 3rd ed. ( Englewood Cliffs.NJ: 
Prentice-Hall, 1997 ), pp. 234-238. 
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对应 ;1 = 5 的特征 向量 : 


对应 ;1 = -3 的特征 向量 : 


和 v 2 = 


和 v 4 


由定理 7, 向量集合 {v, ， ... ， v 4 } 是线性无关的，故 P = [v, … v 4 ] 是可逆的，且有 A = 


其中 


练习题 


-8 -16 0 0 
4 4 0 0 

10 10 
0 10 1 


, D 


5 0 0 0 

0 5 0 0 

0 0-30 
0 0 0 -3 


计算 W , 


2 .设 


若已知 v, 和。是 /1 的特征向量，将对角化 . 


3. 设 4x4 矩阵 A 的特征值是 5, 3 和 -2, 并且已知对应又 = 3 的特征空间是 2 维的，你能否判断 A 是可 
对角化的？ 

习题 5.3 


4 3Ho ：] 

2 - -[-3 M 二 1 


计算，， （ 为正整数 
3. 


计算 

■2 

1 2 r 




5- 

1 

3 1 





1 

2 2_ 






"1 1 

2 

"5 0 o' 

"1/4 1/2 1/4" 


= 

1 0 

-1 

0 1 0 

1/4 1/2 -3/4 

= PDP ' , 


1 -1 

0 

0 0 1 

1/4 -1/2 1/4 


r ^ oin oi p oi r 1 o' 

[3(a-b) bf[3 lj |_0 b\ [-3 1 

p 3]= [: :] [o 


4 0-2 
2 5 4 
0 0 5 


在习题 5 和习题 6 中，矩阵 /! 被分解为 PDP 1 ， 
利用对角化定理求 A 的特征值和每个特征空间 
的基 . 


■-2 0 -r 

"5 0 O' 

■ 0 0 r 

0 1 2 

0 5 0 

2 1 4 

10 0 

0 0 4 

-1 0 -2 


可能的话，将习题 7~20 的矩阵对角化，习题 
11-16 的特征 值是： （ 11) A = 1,2,3; (12) A = 2,8; 
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(13 )A = 5,1; ( 14) A =5,4; ( 15) 又= 3,1; ( 16) 维的，另一个特征空间是2维的，4可对角化 


A = 2 ,l .习题18的一个特征 值是； 1 = 5, —个特征 
向量是 （-2,1,2 ). 


0 5 


17. 


4 -2" 


-3 4 
-3 1 


-1 —2 
7 4 16" 


-2-2 -5 
4 0 0 


20 . 


4 0 
|0 0 
["5-3 0 
|0 3 1 

0 2 
0 0 

在习题21和习题22中，尸和 D 是 nxn 矩 
阵.标出每个命题的真假，证明你的答案（在做这些 
习题之前先仔细研读定理 5 和定理6及本节的例子). 
21. a . 若存在矩阵 D 和可逆矩阵尸使 AzzPDP — 1 成 
立，则4可对角化. 


4 0-2 


2 5 


0 0 
0-4-61 
— 1 0-3 


-7-16 4 

6 13-2 

12 16 1 
"4 0 0 0' 

0 4 0 0 
0 0 2 0 
0 0 2 


b . 若 IT 有 A 的特征向量基，则4可对角化. 

c . 4可对角化的充分必要条件是4有„个特 
征值，算上重数. 


d . 若 A 可对角化，则4是可逆的. 

22. a . 若 A 有 n 个特征向量，则4可对角化. 

b . 若4可对角化，则4有 n 个相异的特征值. 

c . 若4尸=:尸 D ， D 为对角矩阵，那么尸的非 
零列必定是4的特征向量. 

d . 若4可逆，则4可对角化. 

23. 5 x 5 矩阵 A 有2个特征值，一个特征空间是3 


否？为什么？ 

24. 3x3 矩阵4有2个特征值，每个特征空间是1 
维的，4可对角化否？为什么？ 

25. 4x4 矩阵4有3个特征值，有一个特征空间为 
1维，其他特征空间之一是2维的，4是否可 
对角化？说明理由. 

26. 7x7 矩阵4有3个特征值，一个特征空间是2 
维的，其他特征空间之一是3维的，4是否不 
可对角化？说明理由. 

27. 证明，若4可对角化且可逆，则亦可对角 
化. 

28. 证明，若 A 有 n 个线性无关的特征向量，则 jT 
也有《个线性无关的特征向量.（提示：用对 
角化定理 .） 

29. 分解式4 =尸0/^不是惟一的，用例 2 的矩阵 
^来证实这一事实.若 g， 利用例 2 

的结果求矩阵巧，使得4 = 

30. 对例2的4和 D ，求不等于尸的可逆矩阵尸 2 ， 
使得4 = P 2 DP {' . 

31. 构造一个非零的 2x2 可逆但不可对角化的矩 
阵. 

32. 构造一个不是对角阵的 2x2 可对角化但不可 
逆的矩阵. 

[M] 将习题 33-36 的矩阵对角化，先用矩阵程 
序的特征值命令求特征值，然后用 5.1 节的方法找 
出特征空间的基. 

-6 4 0 9' 

-3016 

33 . - 1-2 10 

_-4 4 0 7 

"0 13 8 4' 

4 9 8 4 

34 

8 6 12 8 

0 5 0 -4 
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11 

- 6 

4 

-10 -4 


4 

4 

2 

3 

-2" 

-3 

5 

-2 

4 1 


0 

1 

-2 

-2 

2 

-8 

12 

-3 

12 4 

36. 

6 

12 

11 

2 

-4 

1 

6 

-2 

3 -1 


9 

20 

10 

10 

-6 

8 

-18 

8 

-14 -1 


15 

28 

14 

5 

一3_ 


练习题答案 


1 . det ( v 4- A /) = A 2 -3 A + 2 = ( A -2)( A - l ) ， 特征值是2和 . 1 ， 对应的特征向量是 v , = |^| 和 v 2 
构造尸 = [; !} d= [o 1} 心 =PD 广得 


然后 


2 . 计算 Av , 


!][o ；][J 3] = ^ :] [o 6 :] [J 3]= [: 

s mi 

对应的特征向量，因此 / 

] WD = [o 3 


766 -765 
510 -509 


显然，*>,和》> 2 分别是特征值1和3对应的特征向量，因此 AzPD /- 1 ， 这里 
„ 「3 21 


3. /!可对角化， 对应; 1 = 3的特征空间有一个基 { v ,, v 2 }. 此外， 对应; 1 = 5和；1 = -2各取一个特征向量， 
记为 v 3 * v 4 , 则 { V | ，...， v 4 } 是线性无关的.由定理7，4可对角化.因为向量全属于 R 4 , R 4 的基包含 
的向量个数不超过4,故对 应于; 1 = 5和；1 = -2的特征空间都是1维的. 


5.4 特征向量与线性变换 

在本节，我们将矩阵分解 A = 理解为线性变换.我们还将看到变换 ; c 4 / U 实质上是 

简单的映射 《 — 即使 D 不是对角矩阵时，对矩阵 A 和 Z ) 仍有相似的解释. 

在 1.9 节曾讲到，任意一个从 R ” 到 R m 的线性变换 T 可通过左乘矩阵 A 来实现，矩阵 A 称 
为 T 的标准矩阵. 现在，我们对两个有限维向量空间之间的线性变换也作同样的描述. 


线性变换的矩阵 


设 V 是 n 维向量空间， W 是 m 维向量空间， r 是 V 到 W 的线性变换.为了把 r 与矩阵相联 
系，我们指定5和 C 分别是 V 和 W 的基. 

若; ceV ， 坐标向量 [ ar ] s e ] T , ; c 的像 7 X ； c ) 的坐标向量 [7 X ； c)] c e R m ,见图 5-6. 

容易找出和 [ r ( x)] c 之间的关系.设 V 的基0是冰，…九 }. 若; c = rA +…+ rA ，则 

n 

Ws =; 

_r n 

因为 r 是线性的，故 
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T ( x ) = T { r , b , +■■■+ rjt „) = r , T ( b ,)+- + r n T ( b „) 
利用 VV 的基 C ， 可以用 C - 坐标向量来改写 （1 ): 

[7-( x)] f = r ,[ T ( b,)] c +- + r „\ T { b n )\ 


(2) 



因为这些 C - 坐标向 M 都属于 K "， 向 童等式 （2) 可以写为矩阵等式 
[7 Xx)] c = M [ x] e 

其中 

M=[[nb t )l [7^ 2 )]c •… tm)] c ] 

矩阵 Af 是7的矩阵表示，称为7■相对于基 B 和 C 的矩阵.见图 5-7. 


(4) 


乘以 A / 

m 5-7 


.[r(jr)] c 


等式 （ 3) 表明，就坐标向 ft 而 VY , r 对 X 的作用相当于用矩阵 M 左乘 X . 

例1设召=沐，4 2 }是1的基. （ = 是 W 的基 .7" 是的线性变换, 

7'( i ,) = 3 c , -2 c 2 +5 c 3 , T ( b 2 ) = 4 c ,+7 c 2 - c , 

求 r 相对于基 e 和 c 的矩阵 a / . 

解私和匕的像的匕坐标向虽是 



' 3 


' 4 

\. T ( b ,) l . = 

- 2 

. 5. 

, \ T ( b 2 )\ c = 

7 

-1 


因此 


M =\ 
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如果 S 和 C 是同一空间 V 的基， r 是线性变换 r (; c ) = ; c,;ce V ，那么 （4) 中的矩阵 Af 正好是 
坐标变换矩阵（见 4.7 节）. 

V 到 V 的线性变换 

3 w = v，c = s 时，（4)中的 Af 称为 r 相对于 B 的矩阵，或简称为 r 的 B - 矩阵，记为 [ r ] s ， 
见图 5-8. 


[x] B - 


乘以 [ r] s 
图 5-8 


今 [W]S 


的线性变换 r 的 s - 矩阵对所有 v 中的; c , 有 

[ r ( x)] B =[ r ] B [ jc] B (5) 

例2 P 2 — P 2 的映射 r : 7>。+卽 + a 2 f 2 ) = a ,+2 a 2 f 是线性变换.（学过微积分的学生知道 

r 是微分算子 .） 

a . 当基 S = { Uf 2 } 时，求 r 的 S - 矩阵. 

b . 对恥中的每个 p , 验证 [ r ( p)L =[ r ] s [ p ] s . 

解 a . 计算基向量的像 


7 X 1) = 0 零多项式 

7 X 0 = 1 值恒为1的多项式 


T ( t 2 ) = 2 t 

然后写出 r ( i )， r ( f )，; r ( f 2 ) 的 s - 坐标 （ 本例通过观察可以得到），把它们放在一起组成 r 的矩 阵: 


[r(i)] B = 

0 

， [r(f)] s = 

V 

°l 

， \T{t 2 )] B = 

2 


L°J 




L°J 


"0 1 o' 

[ T] b =002 
0 0 0 

b . 对一般的多项式/>(0=^。+郎+如 2 ，我们有 


lT(py\s = tct| +2a2,]e = 2ct2 
0 


"0 1 Ol|"a 0 ' 

= 0 0 2 a , =[ T ] B [ p] B 

00 Oj[a 2 
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见图 5-9. 


R n 上的线性变换 



图 5-9 线性变换的矩阵表示 


在涉及 R " 的应用问题中，线性变换首先表现为一个矩阵变换 Ac . 假设是可对角化 
的，那么存在由 A 的特征向量组成的 R n 的基此时，下面的定理8表明 T 的矩阵是对角矩阵， 
•这 样，把4对角化相当于找到变换 Ac 的对角矩阵表示. 


定理8 (对角矩阵表示） 

设 A = PDP _' ，其中£>为 fjx / j 对角矩阵，若 R ” 的基 B 由 /»的列向量组成，那么 Z ) 是变换 jthAx 
的 6- 矩阵. 


证 E 尸的列向量为虼…太，则有石…办 J . 此时， 尸是 4.4 节中讨论过 
的坐标变换矩 阵朽， 其中 

rtx] B = JC 和 [ x] B =尸― i 

若 jre R ”, r ( jc ) = At ， 那么 


[r] B = [ [r^)] B -[m)] B ] 由 [7% 的定义 

=[[4 私 ]5… UA„]b] 由 r(Jt>=At 

…广仙„] 坐标变换 

= 尸 _| 川 >「..^] 矩阵乘法 

= P'AP 

由 A = PDP ' , 我们有 [ r] B = P'AP = D . 


( 6 ) 


例3设 d ，® 2 —® 2 的变换 r : r ( jc )= Ac . 求 R 2 的一个基 B ， 使得 r 的矩阵 
是对角矩阵. 

解由 5.3 节的例2,我们知道 A = PDP ~\ 其中 

- [-14 - [os] 
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P 的列向量，记为 A, 和 A 2 , 是 A 的特征向量，由定理8,若取 = 则 D 是 r 的 fi- 矩阵. 

映射和描述的是相对于不同基的同一个线性变换. ■ 

矩阵表示的相似性 

定理8的证明并没有用到 D 是对角矩阵这一 事实. 因此，若 A 相似于 C， 即有 AsPCP— 1 , 
如果6由 P 的列向量组成，则(:是变换的 B- 矩阵.分解 A sPCP— 1 如图 5-10 所示. 


图 5-10 两个矩阵表示的相似性 A = PCP 一 1 

相反，若的变换 r : r(x) = Ac ，而 B 是 r " 的任意一个基，那么 r 的 B- 矩阵相似 
于 A •其实，在式 ( 6 ) 的计箅中已经证明若 P 是以0的向量作为列构成的矩阵，那么 [3l s =P ' AP . 
因此，所有相似于 A 的矩阵的集合与变换的所有矩阵表示的集合是同一集合. 


例 4设/1 = 


A 的特征多项式是(又+ 2) 2 ,但特征值 -2 的特征 


空间只是一维的，因此 A 是不可以对角化的.但是，有一组基5 = {私，心}能够使得变换 
的6-矩阵是三角矩阵，称为 A 的约当形. 0 求 A 的 fi- 矩阵. 

解 如果 P = [A, A 2 ]， 则 fi- 矩阵是 PAP， 计箅 


L 2 -3」 h Oj — L 0 - 2 」 

注意 A 的特征值在对角线上. 

数值计算的注解计算6-矩阵 P H AP 的一个有效方法是先计算 AP ， 然后用行变换将 
增广矩阵 [P AP ] 化为 [/ P -' AP ], 这样就不需要单独计算 P - 1 了，见 2 .2节的习题 12 . 


假设 r 是 p 2 到 p 2 的线性变换，相对于基 s = {U/ 2 } 的矩阵是 [r] s = 0 


求 r(ao + 卽 + 卽 2 ), 


2. 设 /4， fi ， c 是 nxn 矩阵，我们已经知道若4相似于 B ,那么 B 亦相似于/!,这个性质和下面的结论说明 


㊀每个方阵都与一个若尔当型矩阵相似.可以导出若尔当型的基包含有4的特征向量和所谓的“推广的特征向量，，.见 
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“相似”是等价关系 .（ 行等价是等价关系的另一个例子 .） 证明 （ a ) 和 （ b ). 

a . 4相似于 

b . 若4相似于 B , B 相似于 C , 那么4相似于 C . 

习题 5.4 


1 . 设 B 和分别是向量空间 v 
和 w 的基， ； r : V 4 W 是线性变换， 

7-(*,) = 3 d , -5 d 2 , T ( b 2 ) = - d l +6 d 1 ， nb ,) = 4 d 1 
求 7" 相对于 B 和 P 的矩阵. 

2. 设 V = { d u d 2 ) mB = [ b „ b 2 ) 分别是向量空间 V 
和 W 的基，是线性变换， 

r ( rf ,) = 2 A ,-3* 2 , T (, d 2 ) = ^ b ,+5 b 2 
求 7" 相对于 P 和 B 的矩阵. 

3. 设£： = {«,，《 2 ，《 3 }是18 3 的标准基 ， B = { b u b 2 , b ,} 
是向量空间 V 的基， r : R 3 ^ V 是线性变换， 
7(^,^ 2 ,^ 3 ) = (^ 3 -X 2 )*, -(JT, + X 3 )*2 +U ~^)*3 

a . 计算 rhXTXeATXe ,). 

b . 计算 {. ne ^ XT ^ elT ^% . 

c . 求 r 相对于 f 和 b 的矩阵. 

4. 设 6 = 是向量空间 V 的基〜 r : V 4 R 2 

是线性变换. 

T(xfix + x 2 b 2 + xjt ,) = \ 2X ' ~ 4 ^ 2 + 5X A 
L - x 2 + 3 x , 」 

求 r 相对于 B 和 R 2 的标准基的矩阵. 

5. 设 7" : P 2 4 P 3 是将多项式 〆 0映射为多项式 
(r + 5) p ( r ) 的变换 • 

a . 求 p ( r ) = 2 -r + r 2 的像. 

b . 证明7 1 是线性变换. 

C . 求 r 相对于基 { I ， u 2 } 和 { \, t , ef ) 的矩阵. 

6 . 设 7" : P 2 -> P 4 是将多项式 p ⑴映射为冲)+ t 2 p ( t ) 
的变换. 

a . 求 〆 r ) = 2 -f + r 2 的像. 

b . 证明 7" 是线性变换. 

c . 求 r 相对于基 { 和 { 的矩阵. 

7. 假设映射 r : p 2 -» p 2 定义为 

T ( a 0 + a ] t + a 2 t 2 ) = 3 a 0 + (5 a 。 -2 a,)t + (4 a , + a 2 ) t 2 
并且是线性的，求 r 相对于基 B = { Uf 2 } 的矩阵. 


8. 设是向量空间 V 的基， T 是 V — V 
的线性变换，其相对于 B 的矩阵是 

■ 0-6 1 

[7%= 0 5-1，求 7*(3*, -他）. 

1 -2 7 

P(-l) 

9. 定义 P 2 — K 3 的变换 r 为 7"( p )= p (0). 

.P ⑴. 


a . 求 p ( f ) = 5 + 3 f 在变换 7" 下的像. 

b . 证明 r 是线性变换. 

C. 求 r 相对于 P 2 的基和 K 3 标准基的矩 
阵. 


「 P (-3)1 


10. 定义 p 3 — r 4 的变换 r 为 r ( p )=| 


P (- i ) 

p ( i ) 


P (3) 


a . 证明 r 是线性变换. 

b . 求 r 相对于 P 3 的基 { u , r 2 , r 3 } 和 R 4 标准基 
的矩阵. 

在习题11和习题12中 ， S = { 私太} ，求变换 


的矩阵. 



在习题13~16中，定义 R 2 — R 2 的变换 r 为 
T ( x ) = Ax ,求 R 2 的基使得[7%为对角矩阵. 



17•设 A = 和 B = 
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定义 r:R 2 -»K 2 为 r(*) = At. 

a. 证明&是/!的特征向量，但4不可对角化. 

b. 求 7" 的矩阵. 

18. 定义 r : R 3 4K 3 为 r(*) = >U ,其中4为 3x3 
矩阵，特征值是5和 -2. 是否存在 R 3 的基， 
使得 7" 的矩阵是对角矩阵？试做讨论. 

证明习题 19-24 的命题，题中矩阵为方阵. 

19. 若/!可逆且相似于 S， 则 S 可逆且疋 1 相似于 
B ' .( 提示： 存在可逆矩阵 P ,使得 P 'AP = B , 
解释 fl 为什么可逆，然后找一个可逆矩阵 G， 
使得 G—WGsfi— 1 . > 

20. 若 A 相似于 B, 则^相似于 B 2 . 

21. 若 B 相似于 C 相似于则 B 相似于 C. 

22. 若4可对角化， B 相似于则 B 亦可对角化. 

23. gS = p-UP，JC 是4对应特征值 A 的特征向 
量，那么 p-i 是 fl 对应 A 的特征向量. 

24. 若/!与 B 是相似的，则它们有相同的秩.（提 
示：参考第4章补充习题13和 14.) 

25. 方阵/!主对角线元素之和称为/!的轨迹，记为 
tr/1. 可以证明对任意的两个 nxn 矩阵 f ■和 
G , W tr(FG) = tr(GF). 证明，若4与 相似， 
则 tr/4=trB. 

26. 能够证明矩阵4的迹等于4的特征值之和，在 
A 可对角化时验证这个结论. 

27. 设 1 =『，6 = {私，...人}为 V 的基 ， W = R n ,£ 
为 W 的标准基 ./:/(:«:) = :r 是] T 4 IT 的恒等 
变换，求/相对于6和£:的矩阵，这个矩阵在 


4.4 节被称为什么矩阵？ 

28. 设V和 W 是同一向量空间，其基分别是 

B = 和 C = [c u -,c„},I 是 的 

恒等变换，求/相对于 B 和 C 的矩阵•这个矩阵 
在 4.7 节被称为什么矩阵？ 

29. 设V是向量空间，基为 B = ,求 

的恒等变换/的矩阵. 

[M] 对习题30和习题31,求变换 *h4At 相 


对基5 = 
30. A 


= 


{私力 2 力 3 }的5—矩阵 
-14 4 -14l 

-33 9 -31 

11 -4 11 


-2 ,*2 = 



-7 -48 -16. 


-3' 


-2' 

31. A = 

1 14 6 

-3 -45 -19 

，办 1 = 

1 

-3 

，办2 = 

1 

-3 


32. [M] 变换 r 的标准矩阵为4，求 R 4 的一个基 
B, 使得[7%为对角矩阵. 

15 -66 -44 -33" 

0 13 21-15 

1 -15 -21 12 
2-18 -22 8 


练习题答案 


1. 设冲)= 0。+郎+叫 2 ，计算得 



'3 4 O' 

a 0 


3a 0 + 4a x 

inp)], = 

0 5-1 

«i 

= 

5ai -a 2 


1-2 7 

a 2 


a 0 -2a x +la 2 _ 


故 7"(P) = (3a 0 + 4a,) + (5ai - a 2 )/ + (a 0 - 2a, + la 2 )t 2 . 

2. a. A = (ly'Al , 所以 4 相似于 

b. 由假设，存在可逆矩阵 P 和 G， m»B = P'AP^C = Q-'BQ, 代人并利用逆运算性质， WC = G 1 B(2 = 
Q \P 'AP)Q = (PQY'A(PQ) ,这一等式表明4相似于 C . 
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5.5 复特征值 


矩阵的特征方程含有《次多项式,如果考虑复根，方程恰好有《个根，重根重复计箅.本 
节我们将看到假如矩阵4的特; 6E 方程有复根，那么这些复根将给我们提供有关4的关键信息. 
关键的问题是让 A 作用于《维复空间 C" 中的《元复数 . e 


我们对 C” 感兴趣并不是为了把前几章的结果推广，尽管这可以开辟线性代数应用的新领域 @ . 
然而，对复特征值的研究能使我们去揭示各种实际生活问题中出现的某些实矩阵中隐藏的信息. 
这些问题包括很多蕴涵周期运动的实动力系统，振动和空间的某种旋转. 

建立在 R" 基础上的矩阵特征值、特征向量理论同样可以很好地应用到 C”. 因此，一个复 
数 A 满足 det(A-A/) = 0 当且仅当在 C" 中存在一个非零向量I ，使得 = 我们称这样的;I 
是复特征值， jc 是对应;I的（复）特征向量. 

例1假设4 = 那么 R 2 上的线性变换将平面逆时针旋转 1/4圈 • A 的作 

用是周期性的，因为在旋转4次1/4圈后，向量又回到了它的初始位置，很明显没有非零向量 
被映射成自身的数倍，所以4在 R 2 中没有特征向量，因此也没有实的特征值.实际上， A 的特 
征方程是 


只有复根 A=i 和; U 


因此 i 和 -i 是特征值， 


A 2 +1 = 0 

但是，如果我们让 A 作用在 C 2 上，那么 

「° ■ 

1 01 




和是对应的特征向量（在例2中讨论求复特征向量的方法）. 
-1」 [1 


下一个例子的矩阵是本节的主要焦点所在. 

例2设4 = [^ 7 5 5 求 A 的特征值及每个特征空间的基. 

解 4的特征方程是 

f 0.5 — X —0.6 1 

0 = det 075 1 i 一又=( 0 . 5 —又 )( U 一又 )-(-°. 6 )( 0 . 75 )=又 又+ 1 

依求根公式，得 A = ■^■[1.6 士= 0.8 士 0.6i . 对特征值 A = 0.8 — 0.6i ， 构造 


0参考附录 B 中对复数的简短讨论，有关实向量空间的矩阵代数和概念同样适用于复元素和复数的情形.特别地， 
对于有复元素的 mxn 矩阵 A , : c ，_ yeC ” 及 c.deC ,有 A(cr +办 ）= cAr + _ . 

© 线性代数的另一课程通常讨论这些主题，它们在电子工程中非常重要. 
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A -(0.8-0.61)/： 


"0.5 -0.6 

0.75 1.1 

"-0.3 + 0.6 i 


" 「I 


0.8-0.6i 0 1 

0 0.8-0.6iJ 

-0.6 I 


L 0.75 0.3 + 0.6 iJ 

由于有复数运算， 手工 做对增广矩阵行化简是相当慢的.不过，细心观察就能找到简化问题的 
方法： 因为 0.8-0.6 i 是特征值，我们知道方程组 

(—0.3 + 0.6 i)xi — 0.6^2 = 0 ( 2 ) 

0.75 x ,+(0.3 + 0.6 i ) x 2 =0 

有非零解（这里的； C , 和；^可能是复数），因此， （2) 中的2个方程确定的 X ,与 x 2 之间的关系是 
同一关系，这样就可以通过其中的一个方程将某个变量用另一个来表示 0 
由 （ 2 ) 的第2个方程得 

0 J 5 x , =(-0.3-0.6 i ) x 2 
X \ — (-0.4 —0.8 i ) x 2 

为去掉小数，取; c 2 =5, 有； ^=-2-41. 对应; U 0.8-0.6 i 的特征空间的基是 

V,= L 5 J 

对 ; l = 0.8+0.6 i 做同样的计算，可求4特征向量 

v 十 ; 41 ] 

为验证结果是否正确，可以计算 


Av 2 = 


0.5 -0.6 


1 r-2 + 4i]_"- 
_ 5」一_ 


-4 + 2 \ 
4 + 3 i 


= (0.8 + 0.6i)v 2 


■ 


办实质上是一个旋转变换，画出一些适当的点 


二0.75 1.1 

非常意外，例2的矩阵 A 确定的变换. 

后，这一事实会变得更明显. 

例3与例2中的矩阵 A 相乘去影响点，通过以下方法可以看到这种影响.先画出一个随 
机的初始点（如和=(2,0))，然后画出重复乘 A 后该点的后续图像 • S 卩，画出 
\ 0.5 -0.61 
= [0.75 1.1_ 

_「0.5 -0.6] n .0|_|-0.4 

_ 丨0.75 1.1 1 1 1.5 rl 2.4| 

X3 = AX2 


■ Ax 0 : 


x 2 = Ax x 




在图 5-11 中，用粗点显示 JC 。, …， JC 8 , 用细点显示的是 JC 9 ，…， JC , 00的位置，序列分布在椭圆形的轨 
道上. 


© 另一种理解是 （ 1 ) 中的矩阵是不可逆的，因此，它的行向量线性相关（类似 C 2 中的向量）故其中的一行是另一行 
的（复）数倍. 
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厶、’ 

图 5-11 点*。在有复特征值的矩阵的作用下的迭代 ■ 

当然，图 5-11 没有解释为什么会发生旋转，旋转的秘密隐藏在复特征向量的实部和虚部. 

向置的实部和虚部 

C ■的复向量 at 的共轭向量: f 也是 C " 的向量，它的分量是 I 对应分量的共轭复数，向量 Rex 
和 Imjc 称为复向量 jc 的实部和虚部，分别由 jc 的分量的实部和虚部组成. 

那么 



"3- i " 


"3" 



例4 假如 jc = 

1 | 

= 

0 

+ i 

1 


2 + 5 iJ 

i 

_2」 


5_ 




Y 


Rex = 

0 

,Im 



1 

2 - 



•-r 


"3" 


"-1" 


"3 + i" 

1 

-5 」 

"i 

0 

2 

-i 

1 

• 5 - 

= 

-i 

2-5 i _ 


假设是可能有复元素的矩阵，那么，以的元素的共轭复数为元素的矩阵记为云. 
复数的共轭运算性质对复矩阵代数亦 成立： 

rx = r x, Bx = B x, BC = B C, rB = r^ 

作用于 C " 上的实矩阵的特征值和特征向置 

设 4 为 nx/i 的实矩阵，那么石= ]; = ;，假如; I 是 4 的特征值， x 是对应 A 的特征向量， 

那么 

_ Ax = Ax = Xx = X x 

故 A 同样是4的特征值，而 i 是对应的特征向量.这表明，当4是实矩阵时，它的复特征值以 
共轭复数对出现（在这里或别的地方，我们用术语“复特征值”来表示形如; l=a + W ， fc *0 的特 
征值）. 

例 5例2的实矩阵的特征值是共轭复数对 o .8-0.6 i 和 0.8 + 0.6 i . 对应的特征向量同样是共 
辄复向量 

卜 ■ 




V '、'、 


,/!x4; 


气 
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例 6 为计箅有复特征值的 2x2 实矩阵提供了基本模式. 

例6设 C = 一其中为实数且不都等于零•那么 C 的特征值是; l = (见本 

节末尾的练习题 .） 同样，假如 ’ 那么 

[a/r -blr~\\r Ol [cos<p -sin<pl 
C ~ r \btr rj [sin<p cos<pJ 

这里的 炉是正 jc 轴与 (0 ， 0) 到 (a ，幻 射线的夹角.看图 5-12 和附录 B ， 角炉称为 A = fl±W 的福角. 
因此变换可看作由旋转角度和倍乘|又|变换复合而成（见图 5-13). 



倍乘 


旋转 


图 5-12 


图 5-13 旋转后倍乘 


最后，我们准备讨论有复特征值的实矩阵中隐含的旋转 • 

一 0.5 -0.61 , „ \-2-Ai 

0.75 1.1 丨 I 5 

—-2 


例 7 与例 2 —样， A: 


i ]' A= 

P = [Revj ImVj] = 


同时，设 P 是 2 x 2 实矩阵， 


并令 


C = P l AP- 


1 「0 4] r 0.5 -0.6 -2-4 

对 -5 -2 」 [0.75 l.lj L 5 0 

由例6，因为 | A | 2 =(0.8) 2 +(0.6) 2 =1， 故 C 仅是旋转变换.由（：=厂^/>，得 


41 _n 

3」= 1 j 


0.8 - 0.6 

0.6 0.8 


A = PCP~ 


•0.8 -0.6l 


0.6 0.8」 

A “含有”旋转！矩阵 P 提供变量代换 ， Mx = Pu . A 的作用相当于将 x 代换为《，再经 
过旋转，然后又代换回初始变量，见图 5-14. 


变量代换 


变量代换 


图 5-14 由复特征值引起的旋转 


■ 
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下列定理表明例7的计算适用于任意有复特征值又的 2 x 2 实矩阵.证明利用了结 论:若 A 是 
实矩阵，则 y 4( Rejc ) = ReAc 和 >4( Imjc ) = Imy 4 jc , 若 X 是对应复特征值的特征向量，则 Rex 和 tax 
是线性无关的 •（ 见习题25和 26.) 这里省略细节. 

定理9设 A 是 2 x 2 实矩阵，有复特征值;及对应的 C 2 中的复特征向量 V ， 


那么 


A = PCP ' , 


其中/> = [Rev Imv],C 




在更髙维矩阵中亦存在例7中出现的现象.例如，若 A 是有复特征值的 3 x 3 矩阵，那么在 R 3 
中存在某个平面，4对平面的作用是旋转（可能还结合倍乘），平面中的每个向量被旋转到该 
平面的另一点上，我们说平面在>1的作用下是不变的. 


例8 


'0.8 -0.6 0 
矩阵4= 0.6 0.8 0 

0 0 1.07 


有特征值 0.8 J :0.6 i 和 1.07. 


為心平面（第3坐标为0 ) 的任一向量 h >。 被 A 旋转到该平面的另一位置上•不在该平面的任一 
向盘*。的坐标乘1.07,图 5-15 显示了点和*。=(2,0，1>乘 A 后的迭代结果. 



练习题 


图 5-15 点％和 Jt 。 在有复特征值的 3 x 3 矩阵作用下的迭代 


证明： 若 fl 和 ft 是实数，则 A 
习题 5.5 


a — b 
= b a 


的特征值是 


对应 的特征向量是 [ _^|和|^_ 


让习题 1-6 的每个矩阵作用在 c 2 , 求矩阵的 
特征值及对应 C 2 中特征空间的基. 




在习题 7-12 中，用例6写出 A 的特征值.在 
每一例中，变换 Ac 由旋转加倍乘复合而成. 
求旋转的角度 ？）（ - n « p^n ) 和倍乘因子 r . 
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求可逆矩阵 P 和形如 

I 的矩阵 C ，把所给的矩阵表示为 A = PCP 1 . 
L & «」 

对习题13~16,可利用习题1~4的结果. 

^ 「1 一21 .■ 「5 -51 


15. 


-2 


17. 


19. 


18. 


20 . 


[0.4 0.6 J 
「-1.64 -2.41 


卜2 3 J 

口 

ri .52 -0.7] 

)_0.56 0.4 J [ 192 2.2 J 

21. 在例2中，解 （2) 中的第1个方程，用 X ,表 
示&，并由此求得 a 的特征向量 

证明是例2中 v , 的（复）数倍. 

22. 设 ASnxn 的复（或实）矩阵，是复特征 
值对应 C " 中的复特征向量.证明，对任意非零 
的复数向量是 A 的特征向量. 

第7章将把重点放在具有性质 A T = A 的矩阵 
A 上，习题23和24证明了这种矩阵的特征值必定 
是实数. 

23. 设 nxn 实矩阵 A 有性质 A t = A,jc 是 C " 中的向 
量，令9 =芦如.下面的等式通过验证？=<?证 

练习题答案 


明了 g 是实 数. 给出每一步的理由. 
q = x r Ax = x r Ax = x T Ax =(x T Ax) T = x T A T x = 分 

(a) (b) (c) (d) (e) 

24. 设 nxn 实矩阵 A 有性质 A T = A. 证明，若对 
jcsC " 有 At = ；U, 则; l 是实 数， 而 Jt 的实部 
是 A 的特征向量.（提 示： 计算 jfMx 和利用 
习题23的结果，并检査 At 的实部和虚部 .） 

25. 设 A 是 nxn 实矩阵， xeC" ， 证明 Re(At) = 
/4(Re;t) 和 Im(/4x) = /4(Inur). 

26. 设 A 是 2x2 实矩阵，有复特征值; l = a-W 
(<>矣0)和对应 C 2 中的复特征向量 v ， 

a. 证明 /4(Rev) = aRe*>+tImv 和 /4(Imv) = 
-feRev + alm* 1 . (提示:记 v = Rev+ilmv , 
计算 Av .) 

b. 假设 P 和(：是定理 9 给出的矩阵，则 


AP = PC. 

[ M ] 在习题27和习题28中，求所给矩阵 A 的 
分解式 A sPCP - 1 , 其中(:是由形如例6矩阵的 2x2 
子矩阵组成的分块对角矩阵.（对每一共轭对复特 


征值，利用属于 C 4 的特征向量的实部和虚部来产 
生尸 的两列 .） 

0.7 1.1 2.0 


27. 


-2.0 -4 
0 -0 
1.0 2 


-8 


记住，要验证向量是否为特征向量是很容易的，并不需要检验特征方程.计算 

^{ 1 "!] [-!] = t-!i] =(a+W) [-!] 

因此，是对应 ; l = a + W 的特征向量，从本节讨论的内容知道，—定是对应 I = 的特征向量. 
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5.6 离散动力系统 

特征值和特征向量提供了线索，使我们理解由差分方程 心 +1 =如*描述的动力系统的长期行 
为或 进化. 这种方程可用来建立人口动态变化的数学模型，如 1.10 节的人口变化模型， 4.9 节 
的各种马尔可夫链及本章介绍性的斑点猫头鹰数学 模型. 向量 Jt * 给出系统随时间推移（记为 A :) 
的相关 信息. 例如，在斑点猫头鹰例子里， jc* 表示在时间 A : 三 个年龄段的猫头鹰的数目. 

由于生态问题要比物理或工程上的问题容易描述和解释，本节的应用焦点放在生态问题上. 
但很多的科学领域存在动力系统.例如控制系统的标准大学课程对动力系统的某些方面进行了 
讨论.这些课程中的现代状态空间设计方法就主要依赖于矩阵代数 0 . 控制系统中的稳态响应在 
T 程上等价于我们在这里所说的动力系统的“长期行为”. 

一直到例6,我们假设4可对角化，有《个线性无关的特征向量 v ,, …,对应的特征值 
人，…又.为方便起见，假设特征向量已按…>|又„|的顺序排列好.因为{»>,，•••，》>„}是 
IT 的基，故任一初始向量； c 。 可以惟一表示为 

JC 0 = c , v , + ••• + c„v„ (1) 

x 。 的这种特征向量分解确定了序列{^}所发生的 情况. 下一步的计算将 5.2 节例5的简单情况 
一般化. 

因为 V, 是特征向量，所以 

x , = Ax a = ClAvi + ••• + c „ Av „ 

= c , A 1 v 1 + ". + c „ A „ v „ 

一般有 

X t = 0 ,(^)^, + ••• + c „( A „)* v „ ( k = 0X2 ,--) (2) 

下列例子说明当时， （2) 会出现什么结果. 

捕食者-食 饵系统 

在加利福尼亚州的红木森林深处，作为老鼠的主要捕食者，斑点猫头鹰的食物有80%是老 
鼠.例1利用线性动力系统来建立猫头鹰和老鼠的自然系统模型.（实事求是地讲，这个模型在某些 
方面与现实不符，但它能够为环境科学家们所用的更复杂的非线性模型的研究提供一个起点 .） 

例1用心=1^1表示在时间 ( A : 的单位是月）猫头鹰和老鼠的数量，认是在研究区域 

猫头鹰的数量，私是老鼠的数量 （ 单位是千只）. 

设 

0k +\ = (0.5)0* +(0.4)尺* ( 3 ) 

h =- p - 0 k +(1.1)7?* 


参见 G. F. Franklin, J. D. Powell，and A.Emami-Naeimi, Feedback Control of Dynamic SystemsAth ed. ( Upper Saddle 
River,NJ: Prentice- Hall, 2001 ). 这本大学教材对动力模型作了详细介绍（第2章）.在第6章和第8章讨论状态 
空间设计. 
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其中 p 是被指定的正参数.第1个方程中的 (0.5)0* 表示，如果没有老鼠 
为食物，每月仅有一半的猫头鹰存活下来，而第2个方程的(1.1)氏表明 
如果没有猫头鹰捕食老鼠，那么老鼠的数量每月增长10%.假如有足够 
多的老鼠， （0.4) 氏表示 猫头鹰增长的数量，而负项 -p O * 表示由于猫头 
鹰的捕食所引起的老鼠的死亡数量.（事实上，一只猫头鹰每月平均吃 
掉 lOOOp 只老鼠 .） 当 p = 0.104 时，预测该系统的发展趋势. 

解当 p = 0.104 时，算出方程组 （3) 的系数矩阵 A 的特征值是 
人 =1.02 和; U = 0.58. 对应的特征向量是 





初始向量真0可表示为 X 。 =^ W + c 2 v 2 ，那么对 ft >0 

^=^( 1 . 02 )*^+^( 0 . 58)^ 2 


= c,(1.02)*^j+c 2 (0.58)*pj 

当 it 时， (0.58)* 很快趋于零.假设 c , >0，那么对所有足够大的 ik , 近似等于 c ,(1.02)* ， 

我们记为 


:*〜,(1.02)*[二] (4) 

随着 / k 的增大， （4) 的近似程度会更好，故对足够大的 Jt 

c ,(1.02 )* +, ^j = (1.02)0,(1.02)^]^* 1.02 x , (5) 

近似式 （ 5 ) 表明最终 JT * 的2个分量 （ 猫头鹰和老鼠的 数量） 每月以大约 1.02 的倍数增长，即 
月增长率为2%•由（4)， X * 就近似于 （10.13) 的倍数，因此， jc , 的2个分量之比率也近似于 
10与13的比率，也就是说，对应每10只猫头鹰，大致有13000只老鼠. ■ 

例 I 说明了有关动力系统 x * + ,= Ar * 的两个基本事实，若力是《><«矩阵，它的特征值满足 
叫>1和1>|又 4*^2* …, / ij , 是不对应的特征向量，假如 jc 。 由式 （ 1 ) 给出且 C |9 t 0, 那么对足 
够大的 k . 


和 


■*4+1 = 人龙* 


(6) 


x k — Ci ( Ai )* V ] ( 7 ) 

式 （6) 和 （7) 的近似精度可根据需要通过取足够大的 Jfe 来 得到. 由式（6)， A 每时段最终以 
近似人的倍数增长，因此，不确定了系统的最终增 长率. 同样由式（7)，对足够大的 Jfe , jc , 的 
2个分世之比近似等于 v , 对应分童之比 • 5.2 节的例5是;^ = 1的实例. 


解的几何意义 


当4为 2 x 2 矩阵时，可以通过系统发展趋势的几何描述来补充解释代数计算.我们可以把 


302 


第 5 聿 


方程 x t+1 = 看作是 JR 2 中的初始点 x „ 被映射重复变换的描述，由 X 。，,,…组成的图形 
称为是动力系统的轨迹. 

例2当4 = ^^ 时，画出动力系统 x t+l =/Lc t 的若干条轨迹. 

解 >4的特征值是 0.8 和0.64,对应的特征向量是 Vl = j ^^ V 2 =|^| •假如 x ^ c ^+ c ^， 

那么 

x t = c,(0.8)* ^j + c 2 (0.64)*pj 

当 k - oc ^, (0.8)* 和(0.6 4 )*都趋于零，当然 X * 也趋于零.但 X * 趋于零的方式是有趣的. 
图 5 -16显示了几条轨迹的开头几项，这些轨迹的起点在四个角点的坐标为 (±3,±3) 的矩形的边 
界上.为使轨迹容易看清，用细线把轨迹上的点连接起来. ■ 



图 5-16 原点是吸引子 

在例2,因为所有的轨迹都趋于原点，所以原点被称作动力系统的吸 引子. 当两个特征值的 
绝对值都小于1的时候出现这种情况.过原点和最小绝对值的特征值的特征向量 V2 的直线的方 
向是最大吸引方向. 

在下一个例子， A 的两个特征值的绝对值都大于此时的原点称为动力系统的 排斥子 .除 
了（常数）零解， x * + l =/ br * 的所有解是无界的，离原点而去 e 


0 在线性动力系统中，只有原点才可能是吸引子或排斥子，但在映射为非线性的更一般的动力系统中，可 
能存在多个吸引子和排斥子.在这样的系统中，吸引子和排斥子用某个特殊矩阵（有变量元素）的特征值来定义， 
这个矩阵称为系统的雅可比矩阵. ' 
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例 3画出方程 x t + l = Ac t 的若干条典型轨迹，这里 
[1.44 01 

0 1.2 


>4 = 


解 / I 的特征值是 1.44 和1.2,若 x 0 


c , 

— , 
C2 


则 


Xt=Cl (1.44)*1+0 2 (1 .2)* 


1 H 
0 


两项的值随) t 增大而增大，但第1项增大的快一些.因此，过原点和较大特征值的特征向 
量的直线方向是最大排斥方向.图 5-17 显示的是起点接近原点的几条轨迹. 



在下一个例子，原点称为 鞍点， 因为原点在某些方向吸引解，而在其他方向又排斥解.当一 
个特征值的绝对值大于1而另一个特征值的绝对值小于1的时候出现这种情况. 

例 4画出方程的若干典型解的轨迹，其中 


D = 


' 2.0 0 
0 0.5 


( 我们这里用£>和 J 代替 A 和 x 是因为后面要用到该例 .） 


解 £>的特征值是2和 0.5 .若少。 



，那么 


yt =c,2* 


q + c 2 (0.5)* 


(8) 


假如外在心轴，那么 Cl =0, 因此当 *4=0 时， ^^0. 但当。不在心轴时，计算的和式中 
的第1项变得任意大，因此 {_ y t } 是无界的.图 5-18 显示起点靠近或在; c 2 轴上的10条轨迹. 
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前面 3 个例子讨论的矩阵是对角矩阵，为处理非对角矩阵，我们先暂时回到 A 为 nxn 矩阵 
的情形，设 A 的特征向量 { Vl ，…， 》>„} 是 K " 的基•令尸 = [ vn „]， Z ) 是对角线上元素为对应特征值 
的对角矩阵.给出序列 { x t } 满足 x * +1 = 儿 r :*， 由 

= P ~' x t 或 x * = 

定义一个新的序列把这些关系代人方程 x* +l =儿 r * ，并利用 AzPZJP - 1 ， 我们求得 
Py^ = APy k = (PDP')Py k = PDy t 

两边乘广 1 ，得 


J* + i = Dy k 

假如我们记 h 为 〆 幻，用 M 幻，…， hOt ) 表示 〆 &)的分量，那么 




X \ 0 … 0 


抑+1) 


0 X , \ 

y ^( k ) 



\ 0 




_0 0 K _ 

Mk ). 


从1到3>*的变量代换解耦了差分方程系统.例如，>> 1( 幻的变化不受 >> 2( 幻，…， (幻 的影响’因 
为对每一个 + 

等式 x * = 表明 h 是 h 在向量基 ㈦ 下的坐标向量.这样我们就可以通过在新的 
向量坐标系中进行计算来解耦系统 Xt+1 =儿^，当„ = 2时，相当于在使用坐标轴在两个特征向 
量方向上的方格纸. 


例5 


证明原点是方程 X * +1 = 儿 T * 解的鞍点，其中 


A = 


'1.25 -0.75' 
-0.75 1.25 
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并求最大的吸引方向和排斥方向. 

解用通常方法，可以求得 A 有特征值2和0.5,对应的特征向量分别是 

v,=[U 

由于|2|>丨和|0.5|<1,因此原点是动力系统的鞍点，假如那么 

x k = Ci 2* v , + c 2 (0.5)* v 2 (9) 

这个等式看起来像例4的式 （8), 只是用^^和^^代替了标准基. 

在方格纸上，过》^和》> 2 画坐标轴.看图5-19,沿这些轴的移动相当于例3的沿标准轴的移 
动.在图 5-19, 最大的排斥方向是在过》^的直线上，因为 v , 对应的特征值大于 1. 若 X 。在这条 
直线上，则 （9) 中的 c 2 =0, 因此心快速远离原点，最大的吸引方向由特征向量 v 2 确定，》> 2 对 
应的特征值小于1.图 5-19 显示了一些轨迹.若按特征向量轴来看这些图，图的形状与例3的 
一样. 



复特征值 

若 A 为有复特征值的 2 X 2 矩阵，则4不可对角化（当4作用在 1 T 时），但动力系统 x t+1 = 

还是容易 描述. 5 . 5 节的例 3 给出了这样的例子，此时，特征值的长度为 1. 点 X 。 的迭代绕原点 
沿椭圆型轨道作螺旋运动. 

假如4有两个长度都大于1的复特征值，那么原点是排斥子， X 。 的迭代绕原点向外作螺旋 
线旋转.假如复特征值的长度都小于1，原点是吸引子， X 。 的迭代绕原点向内作螺旋线旋转.见 
下例. 

例 6可以验证矩阵 
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有特征值 0.9±0.2 i , 对应的特征向量是图 5-20 显示了初始向量为时 
动力系统 x* +l =如*的3条轨迹. 



图 5-20 与复特征值相关的旋转 


斑点猫头鹰的生存 

回顾本章介绍性实例，我们使用动力系统 x * +1 =私为 California Willow Creek 的猫头鹰建 
立种群模型，在该模型中，•《：*=(/ 1 ， 5 *,«*)的分量分别表示在时间；1：幼年、半成年和成年雌性猫 
头型的数量， 4为阶段矩阵 

"0 0 0.33" 

A = 0.18 0 0 ( 10) 

[0 0.71 0.94 

由 MATLAB 算出 A 的特征值大约是；^ + 和； l 3=~0.02-0.21 i ,因为 

|^| 2 =\ M 2 = (-0.02) 2 + (0.21) 2 = 0.044 5 ,故三个特征值的长度都小于 1. 

现在，让 A 作用在复空间 C 3 _ 因为 A 有3个相异的特征值，故对应的3个特征向量是线性 
无关的，形成 C 3 的一个基.记这些特征向量为 Vl , V 2 * V 3 _ 那么 x * + , =如*的通解（用 c 3 的向量表 
示）的形式是 

A = c , ( A , ) 1 V , + c 2 (Aa )* v 2 + c 3 (Aj )* v 3 ( 11 ) 

若初始向量 *。 是实向量，由于 A 是实矩阵，故 x , =/ br 。 也是实 向量. 同样，方程=处*表明 
式 （11) 左边的 X * 也是实向量，尽管它表示为复向量的和，但由于所有特征值都小于 i ，所以 
式 （11) 右边的每一项都趋于零向量_因此，实序列 { x *} 也趋于零 向量. 很不幸’该模型预测 
斑点猫头鹰会最终全部灭亡. 

猫头鹰还有希望吗？回顾本章介绍性实例，在 （10) 的矩阵4中的元素18%源于如下事实： 
尽管有60%的幼年猫头鹰能够活下来，离巢去寻找新的栖息地，但在这60%的幼年猫头鹰中， 
仅有30%的猫头鹰能活下来找到新的栖息地_森林中裸露地域的数量使得搜寻工作变得更困^ 
和更危险，严重影响了寻找栖息地过程中的猫头鹰的存活率_ 



特征值与特征向量 307 


有相当数量的猫头鹰生活在没有或很少裸露地域的地方，这使得有更大百分比的幼年猫头 
鹰能够找到新的栖息地存活下来.当然，猫头鹰的问题比我们这里描述的还要复杂，但最后一 
个例子将会给你一个满意的结果. 

例 7 设幼年猫头鹰的搜寻存活率是 50%， 因此 （ 10) 式中的矩阵 A 的 （2,1) 元素是 0.3 而 
不是 0.18, 用这样的阶段矩阵模型预测猫头鹰数量的发展趋势. 

解 现在 A 的特征值大约是; + 对应;^的特征向 

量为 ViMHUJl ), 并设 v 2 *»> 3 是对应 I 和; la 的（复）特征向量.此时，等式 （11) 变为 
x k = c ,(1.0 l )* v ,+ c 2 (-0.03 + 0_26 i )* v 2 + c 3 (-0.03 - 0.26 i )* v 3 
当 / t — oo 时，向量以乃趋于零，因此 X * 越来越接近（实）向量 cKl . Ol )、, .例1中的近似 
值 （6) 和 （7) 在这里仍适用，因此，猫头鹰数量的长期增长率是1.01，即猫头鹰的数量会缓 
慢增长.特征向量•^描述了猫头鹰在3个年龄段数量的最终分布，每31只成年猫头鹰，对应大 
约有10只幼年猫头鹰和3只半成年猫头鹰. ■ 
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东习题 

. 下面矩阵 A 的特征值是1，2/3和1/3,相应的特征向量分别为 : 

r 7 -2 Ol |"-2 l [2] 「1 

A = - 2 6 2 , Vi = 2 y v 2 - 1 ， v 3 = 2 

9 [_ 0 2 5_| 1_( |_2_| [-2 

r 

若 11 , 求方程 x A+l = 的通解. 

- 2 _ 

.在练习题丨中， 当/ : — oo 时，序列是什 么？ 

] 题5_6 


设 2 x 2 矩阵 A 的特征值是3和1/3,对应的特征 2. 假设 3 x 3 矩阵 A 的特征值是3, 4/5, 3/5,对应 


向量为 J 和彳; ]. { X *}是差分方程 
■^ t+i = 的解 ， Xo = ^ J . 

a. 计算:^=处。.（提示：你不需要知道 A 本身 .） 

b . 求 x * 包含 A 和特征向量 Vl 及心的公式. 


' ll I " 2] 「-3] 「- 2— 

的特征向量为 0 , 1 , -3 .设: 《:。= -5 ,对 

,3」|_-5」 (_ 7」 [ 3 

给定的 x „ 求方程 x * + l =/ U * 的解，并描述当 
A : — oo 时有何结果. 

3. 在例1的动力系统中，若方程组 （3) 的捕食参 
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数 P = 0.2, 预测动力系统的发展趋势（给出 
的公式）.猫头鹰的数量是增长还是下降呢？老 
鼠的情况乂怎样 y 

4. 试确定例1中捕食者-食饵模型中的捕食参数， 
使猫头鹰和老鼠的数量维持在稳定的水平上.此 
时，两者数量的比率是多少‘？模型中的任一参 
数 （ 如出生率或捕食率）的细微变化将引起数 
讀的增多或减少，因此两者数量的平衡是不稳 
定的. 

5. 在古老的 Douglas 冷杉森林中，斑点猫头鹰主 
要以鼯鼠为食.设这两个种群的捕食者-食饵 

矩阵 4 = [^ ° 2 3 ]' 证明，若捕食参数 P 为 

0.325, 则两个种群的数量都是增长的.预测长 
期增长率及猫头鹰与鼯鼠的最终比率. 

6. 若习题5的捕食参数为 0.5, 证明猫头鹰和鼯鼠 
最终都会灭亡. p 取何值时，两者的数量保持 
稳定？此时，两者的数量关系是 什么？ 

7. 设4具有习题1描述的性质. 

a . 原点是动力系统 x ^= Ac * 的吸引子还是排 
斥子还是鞍点？ 

b . 求该动力系统的最大吸引方向或排斥方向. 

c . 作该系统的几何描述，显示最大吸引方向或 
排斥方向，包括若干典型轨迹的草图（不用 
计算具体的 点）. 

8. 若4具有习题2描述的性质，原点是该动力系 

统 ■ Th , 的吸引子、排斥子还是鞍点？求最 

大的吸引方向或排斥方向. 

在习题9〜14中，把原点归类为动力系统 
x* +l = Ar * 的吸引子或排斥子或鞍点，并求最大的 
吸引方向或排斥方向. 

9」=[ L7 1 

卜1.2 0.8 」‘ 


0.4 0.5' 
-0.4 1.3 



12 . 

13. 

14. 



r o .5 

0.6 - 

A = \ 


L^-3 

L 4 

- 

「0.8 

0.3" 

A = \ i 

i 

^-0.4 

1.5」 

i 

1.7 

0.6" 

4= … J 


-0.4 0.7 



"0.4 0 0.21 

「 o.r 

15. 设 4 = | 

0.3 0.8 0.3卜 向量 v ,=| 

0.6 

1 

0.3 0.2 0.5」 | 

i 

0.3 


征向量，4的两个特征值是 0.5 和0.2,求动 
力系统〜=处 4 满足 x 。 = (0,0.3,0.7) 的解 ，当 


时，：会如何？ 


16. [ M ] 4 为 4.9 节习题 16 中 Hertz 租车模型的随 
机矩阵，求动力系统 x t +1 = Ac t 的通解. 

17. 为某动物种类建立阶段矩阵模型.该动物的 
生命周期分2个阶段，幼年期 （ 1岁以前）和 
成 年期. 假设每只成年雌性一年平均生下 1.6 
只幼年雌性.每年，有 30% 的幼年存活下来进 
人成年和 80% 的成年仍然存活.对 00, 设 
l =[ h ， a k ) ， 其中: c * 的分量表示在 A : 年幼年 
和成年的数量. 


a . 构造阶段矩阵4，使得对 O 0 时，有 
x k+ i = Ax k . 


b . 证明动物的数量的是增长的，并计算最终 
增长率和幼年与成年的最终比率. 

c . [ M ] 假设种群最初有 15 只幼年和 10 只成年. 
画4个图显示在未来8年种群数量的变化 
情况： （ a ) 幼年的数量， （ b ) 成年数量， （ c ) 
总数量， （ d ) 幼年与成年的比率（每 年） .什 
么时候 （ d ) 中的比率会达到 稳定？ 要求列 
出产生 （c ) 图和 （d ) 图的程序或命令. 

18. 可以用类似斑点猫头鹰的阶段矩阵为美国野 
牛群建立 模型. 雌性野牛被分为：小牛 （！ 岁 
以前），半成年野牛 （ 1〜2岁）和成年野牛.假 
设每100头成年雌性野牛每年平均生下42头 
雌性小牛 （ 只有成年雌性野牛能够 产崽） .每 
年大约有60%的小牛，75%半成年野牛和95% 
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成年野牛存活. 

的分量表示在 A 年三个年龄段雌性野牛的 
数量. 

a . 构造野牛群的阶段矩阵4，使得对 


k^0,x M =Ax t . 

b . [ M ] 证明野牛群的数量是增长的，预测若 
干年后的增长率和每100头成年野牛对应 
的小牛和半成年野牛的数量. 


练习题答案 

1. 第1步将 x ■。表示为 v ,， v 2 ， v 3 的线性组合.把 [ v , v 2 v 3 : c 。] 行化简，求出系数 c, =2, c 2 = l , c 3 =3 ， 因此 
x 0 = 2 v , + lv 2 + 3v 3 

由于特征值是1，吞和故通解是 


x k =2-1>! J v 2 + 3-^- 

2.当 A 400时， （12) 中的第2和第3项趋于零向量，故 

: 2vl+ [.) V2+3 〔臺 ) Vj 2v ' = 


-2" 


'2 

/! V 

r 

2 

1 


2 


UJ 

2 


-2 


5.7 微分方程中的应用 


本节讲述在 5.6 节研究的差分方程的连续型类推.在很多的应用问题中，有些量随时间连 
续变化，它们与下面的微分方程组 有关： 

Xi = a u x , + ■■■ + a In x „ 

X2 = a 2 iXt + ■■■ + a 2 „ x n 


x „ = a nl x t + ■■■ + a m x n 

这里 々，…，•^ 是 f 的可导函数，导数分别是夂…,; c 巧是 常数.该方程组最主要的特征是线性性 
质.为了便于理解，我们把方程组写成矩阵微分方程 





'^(0' 


- 

- a u 

X{t) = 


， /(f) = 






x„u\ 


.^(0. 



■ a nn _ 


方程 （ 1 ) 的解是向量值函数，该函数定义在某实数区间，.比如且满足方程 （1). 

由于函数求导以及向量与矩哞相乘都是线性变换，故方程 （1) 是线性的.因此，若《和》>是 
〆 =儿 r 的解，则 c « + 办同样也是 x ' = Arr 的解，因为 

(cu + dv ) =cu + dv r = cAu + dAv - A(cu + dv ) 

( 工程师们将这个性质称作解的 叠加） 同样，恒等于零的函数也是方程 （ 1 ) 的（平凡）解.用 
第4章的术语，方程 （1) 的所有解的集合是值属于 1 T 的所有连续函数组成的集合的子空间. 
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有关微分方程的标准教材证明了方程 （ 1 ) 一定存在基础解系.假如 A 是 nxn 矩阵，那么 
在基本解集中存在 n 个线性无关的函数.使得方程 （1) 的每一个解可以惟一表示为这„个函数 
的线性组合_即基础解系是方程 （ 1 ) 的所有解的集合的基.若给定向量 X 。，那么初值问题就是 
构造一个（惟一）函数 X ，满足 x '= 如和 <0) = x 。. 

当 A 是对角矩阵时，可以用初等微积分求出 （ 1 ) 的解.例如考虑 

即有 

•t； ■⑴= 3^,(0 

x ； (t) = -5x 2 (t) (3) 

因为每个函数的导数仅依赖于自身，而不是⑴ 和功) 醜合或 “ 结合”，此时称方麵⑵ 
是解耗的.由微积分，⑴ 酶是邮 ) = Cl e 3 < 和功) = C 2 e - 5 '， Cl ffic 2 为任意常数 • ⑵ 的每一个 
解都可以写成下列 形式： 

这个例子提示我们’对于一般的方程 〆 =如，它的解可能是形如 

x(t) = ve h ( 4 ) 

的函数的线性组合，其中; I 为数， v 为非零向量 .（若 v = 0 , 函数; c ( f ) 恒为零，且满足 〆 =& ) 
注意到 

x\t) = Xvt h 对; c(0 求导，其中》■是常向量 


Ax(t) = Avt k, 式（ 4 ) 两边同乘 a 

因为#不吋能为零，故 AT '( f ) 等于 Ar ⑺当且仅当； t v = Av ，即当且仅当;1是4的特征值，而 |) 是 
对应的特征向量._，每-对觀值-特征向量雖了 x ' = 々的—个解⑷，这种解有时被 
称为微分方程的特征函数.特征函数为求解微分方程提供了方法. 

例1图 5-21 显示的电路可以用微分方程描述 

v 〔 (0"| = ['-(l//? 1+ l//? 2) /C 1 M(R 2 Q) 1 r v ,(o"| 
v;(oJ L 1 /(^C 2 ) -l/(/? 2 C 2 )」 

其中 v , ⑴和咕)是在时间 f 两个电容器的电压，设电阻尺为1欧姆，&为 
2欧姆，电容器 C , 为1法拉， C 2 为 0.5 法拉，并假设电容器 q 的初始电压 
为5伏，（: 2 为4伏.求描述电压随时间变化的公式 Vl(0 * V2(0 . 

解由给出的数据，令°__^ = 0。.，向量工。给 
出了 I 的初值，我们可以求得 A 的特征值是;^ = _ o . 5 和人 =-2，对应的特征向量是 

, vi = HI 和〜七 1 ] 

特征函数 x , ⑴= V ，和 X 2 ( f ) = V 2 e ta 都满足 X ，= Ar ， Xl 和 x 2 的任意线髓合亦同样满足 x ^ =Ax 
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记 x (0) = c , v ,+ c 2 v 2 ， 显然 V , 和 v 2 是线性无关的，故 v , 和 v 2 可生成 1 R 2 ，令 x (；0) = a :。， 可求出(^和 


c 2 . 事实上，由方程 



容易解出 C ,=3 和 c 2 =-2, 


或 


因此，微分方程 = 的解是 



卜 f)]f +2 叫 

U( f )J _ L6e^ 5, -2e- 2 'J 

图 5-22 显示了 在 f > 0的图像或 轨迹，一 起显示的还有其他初始点的轨迹.两个特征函数 X , 


和 x 2 的轨迹包含在 A 的特征空间里. 

当 f ^ oo 时，函数^和^都衰减为零，但^的值要衰减得更快一些，因为它的指数要小 
一些.对应的特征向量》 2 的分量表明，若两个初始电压大小相等但符号相反，两个电容器的电 
压将会很快衰退为零. 



在图 5-22 中，因为所有轨迹都趋近于原点，所以把原点称为动力系统的 吸引子 或汇.最大 
的吸引方向是在较小的特征值;1 = -2对应的特征函数;《: 2 的轨迹上（沿着过原点 * v 2 的直线）. 
起点不在此直线的轨迹渐渐逼近过原点和 v , 的直线，因为它们在 v 2 方向的分量衰减得很快. 
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如果例1的特征值是正数，相应的轨迹形状相同，但轨迹背离原点.此时，称原点为动力 
系统的 排斥子或源， 最大的排斥方向是在包含较大特征值对应的特征函数的轨迹的直线上. 

例 2假设粒子在平面力场中运动，它的位置向量 x 满足 x ' = Ac 和 x (0) = x fl , 其中 
T 4 -5* 


—2 


"2.9" 
: 2.6 


求解初值问题并画出在时粒子的轨迹. 

解 求出/ I 的特征值为人=6和1=-1，相应的特征向量是 
»^=(-5,2)和 v 2 =( l ， l ) 

对任意的常数 Cl * C2 , 函数 

x(t) = c,v,e ；u， + c 2 v 2 e X2 ' = c, Cl 卜 [: h 
是 〆 = Ar 的解，我们要求(:,和(： 2 满足即 

十 [:: 

求得 q =-3/70 和(： 2 =188/70,所求的函数是 

养错 [ m - 

X 和其他解的轨迹如图 5-23 所示. 



_在图 5-23 中，原点称为动力系统的鞍点，因为有些轨迹开始时趋近原点，然后又改变方向 
远离原点而去.当矩阵4既有正的特征值，又有负的特征值时，就会出现鞍点.最大排斥方向 
在过原点和 v , 的直线上，对应于正的特征值，最大的吸引方向在过原点和 V 2 的直线上，对应负 
的特征值. ' 

解耦动力系统 

在下面的讨论中将看到，当矩阵/1有„个线性无关的特征向量，即4可对角化时，例 
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1和例2所用的方法能够用来产生由 = 所描述的动力系统的基础解系 • 

设 A 的特征函数是 

Vie A,1 

是线性无关的特征 向量. 4 P = [ v , … v „]， £>是主对角线元素为人，…，又„的对角矩阵， 
因此有 AsPDP 1 ， 现做变量代换，由 

冲 卜/^文⑴或 x(t) = Py(t) 

定义一个新的函数: V ，代人 x '=/ U ， 有 


A (/>y) = A(Py) = (PDP')Py = PDy (5) 

dr 

由于 p 是常数矩阵， （ 5) 的左边是 /y ，在 （ 5 ) 的两边左乘 p 1 ，得：/= 办或 


命). 


"A, 0 

…0 _ 

yi (0 

yUO 

= 

0 K 

0 

yi(t) 

%(0„ 


0 … 

0 又” 

yn(t)_ 


因为数值函数％的导数 y;(0 仅依赖于 h ，故从 x 到: y 的变量代换解耦了微分方程组•（回忆 5.6 
节类似的变量代换 .） 由 = ，有 y ,(f) = Cl e〜， 对 y 2 ，...,y„ 也有类似的 公式. 因此 





Cl 

y(t)^ 


，其中 



c„e A " r 


C n _ 


= y (0) = P l X (0) = P 'X 0 


为 f 得到原方程组的通解X，计算 


x(t) = Py(t) = [vt ■•- vj^w 


+ ■■• + c„v„e^ 


这就是在例1求得的特征函数的扩展. 


复特征值 

在例3中，实矩阵 A 有共轭复特征值又和叉，对应的特征向量为 v 和 F (回顾 5.5 节，实 
矩阵的复特征值和特征向量共轭出现）.因此 x'=/U 的两个解是 

x,(0 = ve A, 和 x 2 (t) = ve >i (6) 

虽然这些复特征函数对某些计算（尤其是电子工程）是方便的，但对多数的实际应用而言，实 
函数要更合适一些.所幸的是， jc , 的实部和虚部是^ = 的（实数）解，因为它们是形如 （6) 
的解的线性 组合： 

Re(ve Al ) = i[x,(f) + ^], Im(ve A, ) = 士 [ 邮 )- _] 

为理解 Re(ve A '；) 的本质，回忆在微积分中，对任意的数 x, 指数函数^可以通过幂级数 计算： 
e^=l + x + ^x 2 + ■■• + ix"+ ••- 
当 A 为复数时，可利用该级数定义 

e A, =l + (Af)+ 士(又 f) 2 + ...+ 士 (Af)" +... 
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记 ； l = a + 况 （ a 和6是实数），对余弦和正弦函数利用相似的幂级数，可以证明 
= e a, =e a, (cos^ + isin^) 

因此 

ve h = (Re v + i Im v) ■ e" < (cos bt + i sin bt) 

=[(Rev)cosftf-(Imv)sinftf]e' 1< 

+ i [(Rev)sinfef+ (Imv)cos^f] e m 

故 x ' = / U 的两个实解是 

3>,(f) = Rex ,(0 = [(Re v) cos - (Im v) sin bt] e® 

3 > 2 (f) = Im x, (f) = [(Re v) sin + (Im v) cos ] e a, 

可以证明，函数: y , 和: y 2 是线性无关的函数（当 6*0 时 ） . 0 
例3图 5-24 的电路可以用下面的方程 描述： 

Unj - R 2 /L -ML 1 p t l 

UJ"L i/ c -" wo 」 U 」 

其中 4 是通过电感 L 的电流， v c S 电容器 C 的电压，设尺为5欧姆，&为 
0.8 欧姆， C 为 0.1 法拉，/_为 0.4 亨利，若通过电感的初始电流为3安培， 

C 的初始电压为3伏，求计算4和^的公式. 

「-2 -2.5 - _ _ 


解 由所给的数据，得 


和太 0 


10 -1 一 一 
用 5.5 节的方法求得特征值 A = -2 + 5i 及对应的特征向量 v,=|^ 
的复数解是 




图 5-24 


的复线性组合，利用 （7) 式得 


:,(，) = [;] e(- 2+5i )' 和 x 2 (f) =㈡ e'- 2 - 5i), 

=E] 


(cos 5? + i sin 50 


取 x,(r) 的实部和虚部，可以得到实 数解： 
(~-sin5r 
" l(0 = [2cos5 L 
因为: y, 和: y 2 是线性无关的函数，故它们形 = 

|_2cos5r」 


x ( t )- 




2 sin 5 t I 


2sin5r 


因此，通解是 


G 由于 i ⑴是 a ⑴的复共轭，因此，它的实部和虚部分别是，⑴和 - a ⑴.因此，可以利用&⑴或心⑴，但不是 
同时使用两者，来产生的线性无关的解. 
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为满足 x (0) = 


Y 

3 


或者 


见图 5-25. 


要求> 


解得 Cl =1.5 和 c 2 =3 •因此 
["-sin 5t~\ 


冲 ）=i . 5 u^_r +3 l_m 




在图 5-25 中，原点称为动力系统的螺线极点.旋转是由复特征值产生的正弦和余弦函数产 
生的.因为系数6_ 2 '趋于零，故轨迹往里旋转.注意， -2 是例3中的特征值的实部.当4的复特 
征值的实部为正数时，轨迹往外旋转.当特征值的实部为零时，轨迹形成绕原点的楠圆. 


练习题 

3x3 实矩阵 A 有特征值 -0.5，0.2 + 0.3i 和 0.2-0.3i ，对应的特征向量为 



r 


■l + 2i 


l-2i' 

Vi = 

-2 

，v 2 = 

4i 

， v 3 = 

-4i 


iJ 


2 


2 


1. 利用复矩阵， A 能否对角化为 D, SAzPDP- 1 2 3 . 

2. 用复矩阵函数 写出〆 的通解，然后再求出实的通解. 

3. 描述典型的轨迹形状. 
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习题 5.7 

1. 在平面力场运动的粒子的位置向量满足 

jc ' = / L «:.2 x 2 矩阵 A 有特征值4和2,对应的特 1 MM]A = 

征向《：为 K , =^j , v 2 =^j .假设 x (0) = ^ J , 

求粒子在时刻 f 的位置. 

2. 设 2 x 2 矩阵 A 的特征值为 -3 和 -1, 对应的特征 
向鬚:为 k 2 =^J , xW 是粒子在时间 

!的位置. 求初值问题 x ' = / U , 太⑼ 

在习题3~6中，对 rM )， x (0) = (3,2)， 求解初 
值问题 x '(0 = / U ⑴.把原点分类为由 = 描述 
的动力系统的吸引子，排斥子或鞍点.并求最大的 
吸引方向或排斥方向.当原点是鞍点时，画出典型 
的轨迹. 


3. A = 


— I -2 


4. A = 


6 . A ： 


「-2-5 


- 2 " 


在习题7和习题8中，做变量代换解耦方程 
x = Ax . 求出尸和 D ， 写出方程 x ( f ) = / MO , 并 
写出得到分离系统/ =办的计算过程. 

7. 习题5的矩阵 

8. 习题6的矩阵 A . 

在习题9~18中，求 = 的包含复特征函数 

的通解，然后求得实通解，并描述典型轨迹的形状. 


9. A = 


-3 


r-3 -9i 


「4 -3 — 


10. A = 


1-2 


12. A = 


6 -2 


14. A ： 


15. [ M ] A ： 


-8 -12 - 6 ' 
2 1 2 

7 12 5 


"-6 -11 



-A 

-5 

10」 


_ 30 

64 

23] 

17. IM]A = 

-11 

-23 

_9 


6 

15 


4j 


■53 

-30 

-2 


18. [ M]A = 

90 

-52 

一 3 | 



20 

-10 

2」 



19. [ M ] 求例 1 中电路的电压 v , 和 v 2 ( 作为时间 f 的 
函数）的公式 ，设况 =1/5欧姆，尺 2 =1/3欧姆， 
C ,=4 法拉， C 2 =3 法拉，每个电容器的初始 
电压为4伏. 

20. [ M ] 求例1中电路的电压 v ,* v 2 的公式，设 
尺 =15欧姆，艮=3欧姆， C ,=9 法拉， C 2 = 2 
法拉，每个电容器的初始电压为3伏. 

21. [ M ] 求例3中电路的电流匕和电压^的公式， 
设况=1欧姆，尺 2 =0.125欧姆， C = 0.2 法拉， 
i = 0.125 亨利，初始电流为0安培，初始电压 
为15伏. 

22. [ M ] 例6的电路由下列方程 描述： 

KH 二 — 二 ][:] 

其中， L 是通过电感 Z ■的电流， V C S 电容器 C 
的电压.设尺 = 0.5 欧姆， C = 2.5 法拉， L = 0.5 
亨利，初始电流为0安培，初始电压为12伏， 
求计算4和 v c 的公式. 


H(-^ 
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练习题答案 


1. /T 可对角化，因为 A 有三个不同的特征值.当使用复数时， 5.1 节的定理 2 以及 5.3 节的定理5仍然有 
效（证明基本上与实数相同）. 

2. 通解具有以下形式 


■^(0 = ^1 

1 

-2 

e^+c 2 

"l + 2i" 

4i 

e( _, +C3 : 

■l-2i 


1 


2 


2 


其中 c,，c 2 , C3 为任意复数. x(0 的第一项是实的，其他两个实解可以用 xW 的第 二项： 
'l + 2i 

4i e°' 2, (cos0.3f+ isin0.3f) 

2 


的实部和虚部来产生.实通解为 


r 


cos0.3r-2sin0.3r 


sin0.3r + 2cos0.3r 

-2 

e^ 5f +c 2 

^4sin0.3r 

e°- 2 '+c 3 

4cos0.3r 

1 


2cos0.3r 


2sin0.3r 


K 中^/^，为实数. 

3. 因为有负的指数因子，当0=^=0时的任一解逼近原点，其他的解有无界的分量，轨迹朝外旋转.小 
心不要将这个问题错当成 5.6 节的问题.在 5.6 节中，逼近原点的条件是特征值的绝对值小于1,使得 
|A|*^0. 这里的条件是特征值的实部必须是负的，才使得 e A '—0. 


5.8 特征值的迭代估计 


在线性代数的科学应用中，很少能精确知道特征值.所幸的是，一个较精确的数值近似通 
常能达到满意的效果.实际上，某些应用只需要粗略估计最大特征值.下面介绍的第1个算法很 
适合这种情况.同样，它为快速估计其他特征值的更有效的方法提供了基础. 


幕算法 


幂算法适用于矩阵 A 有严格占优特征值（亦称主特征值）人的情况.又,为主特征值的 
意思是人的绝对值比其他特征值的绝对值都大.此时，幂算法产生一个近似人的数列和一个近 
似主特征向量的向量序列.此方法的背景来源于 5.6 节开头的特征向量分解. 

为简单起见，假设 A 可对角化，特征向量 v ,, …, v „ SK " 的基，并且 V ,，…, v „ 已经过排列，使 
对应的特征值 A ,， …，上的绝对值递减，人是主特征值，即有 

|人| > |1| 彡 彡…> |1| (1) 

t ——严格大 

就像我们在 5.6 节式 （2) 中看到的，假设“^^奶+…+ ^入，那么 

A k x = c,(X l ) k v l +c 2 (li) k v 2 + … (fc =1,2 ,…） 
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假设 Cl *0, 等式除于认 )\ 

幻 v 2 + …+ 0 „〔幻 v„ (fc=l,2 , …） （ 2) 

由（ 1) ，所有分数 1/ 人， … ， l / 人 的值都小于 1 ，因此，它们的幂趋于零.故 

当 fc->oo 时， (A,)'*A*x->c,v, (3) 

因此对足够大的 A 、 的数量倍的方向几乎与特征向量 ClVl 的方向相同.由于正的数量倍不会 
改变向量的方向，若给定 Cl *0, 的方向几乎与 v, 或 - Vl — 致 . 

例 1 设 4 = ^^^ ， ^-^ 那么乂的特征值是：和^^^的特征空间是 

过原点和 v, 的直线 . 对 fc = 0, … ， 8, 计算 A*x 并画出过原点和， x 的直线 . 当 /t 增大时会出现什 
么情况？ 

解开头=项的计算是 


「 1.8 0.8] f-0.5] ("-O.r 

^~1_0.2 1.2_| lj = |_ 1.1 



其他项的计算在表 5-1 中给出 . 


表 S-1 向量的迭代 


k 

I 0 1 2 3 4 5 6 7 8 

Akx 

[r] [t: 

]ra [3 e] ra ra [: g ra 


图 5_ 26 显示了向量 x ， Ar ， /bc 2 ， /bc 3 ， Ac 4 . 其余向量太长难于显示，但画出的线段显示出这些 
向量的方向 . 事实上，我们真正想看到的是向量的方向而不是向量本身.这些直线看起来是逼 
近表示 v, 生成的特征空间的 直线 . 更加明确地，由， x 确定的直线（子空间）与由 v , 确定的直 
线（特征空间）之间的夹角 （ 当 /t 4 00 时）趋于零 . 



图 5-26 由 x ， ybr ， A 2 x ，...， A 7 x 确定的方向 


■ 
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当 时，我们可以对 （3) 中的向量(人广力、倍乘，使它们收敛于 c , v ,, 但不能对作 
这种倍乘，因为我们并不知 道人. 不过我们可以倍乘 Yx , 使它的最大分量为 1. 这样，所得序 
列 { x *} 将收敛于 v , 的倍数， v , 的倍数的最大分量也是1.图 5-27 显示了例1的倍乘 序列. 我们 
还可以通过序列 { x * } 来估值人 .当 x * 接近于;^的特征向量时，向量也接近于; 1 ^* ，即的 
每一分量接近于;^与心相应分量的乘积•因为心的最大分量是1,故 Ac * 的最大分量接近于七. 
(这些结论的证明省略了 .） 



估计严格占优特征值的幂算法 

1. 选择一个最大分量为1的初始向量 X。. 

2. 对 /t =0,1，…， 

a . 计算 Ax t . 

b . 设是 At * 中绝对值最大的一个分量. 

C. 计算 x t+1 =(1/ 从） Ax 卜 

3. 几乎对所有选择的 x 。， 序列{叫}近似于主特征值，而序列 { xj 近似于对应的特征向量. 


例2 
到 / t =5. 



j ° -应用幂算法求4的主特征值和对应特征向量的近似值，计算 


解 本例及下一个例子的计算用 MATLAB 完成，虽然这里看到的有效数字较少，但计算 
精确到16位.先计算 Ax 。 ，然后将 Ax 。 的最大分量#。单位化： Ax 0 =^ 幻 
用1/糾倍乘如。得到 Xl ，计算 Ac ,， 并将 Ac , 的最大分量单位化： 


/Xo = 5 . 



又用1/从倍乘 Ar , 得到 X 2 ,计算如 2 ，将 Ar 2 的最大分量单位化: 
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从表 5-2 的数据明显看出， { x *} 接近于 （1,0.2), {队}接近于 7. 这样， （ 1，0.2)就是特征向 

量， 7 是主特征值.容易通过计算来验证小时 ■ 

例2的序列{叫}很快收敛于; 7 是因为 A 的第2个特征值1要比 V 』、得多（事实上， A 2 =l ). 
通常收敛的快慢取决于比率+ /人|,因为用的倍数来估值 ClVl , 主要误差来源于 （2) 中的 
向量 C2 (； UMv 2 (其他的分数\/人可能更小）.若卜/不|接近于1,则{从}和{々}会收敛得 
很慢，此时，可能需要选择其他近似的方法. 

不过幂算法还存在这样的很小可能性，即随机选择的初始 向量； c 在 Vl 的方向上没有分量 （当 
C | =0 时），但计算机在计算心时所产生的舍人误差有可能产生一个向量，该向量在 v , 的方向上 
至少有一个小分量.如果这样的话，心将开始收敛于数倍 V ,的某个向量. 

逆幂法 

在知道特征值 A 的一个较好的初步估值《后，逆幂法可用来对任一特征值近似估值.此时，我 
们令 BzM - a /)- 1 ， 并对 B 应用幂 算法. 可以证明，若人，…,又„是4的特征值，则 B 的特征值是 
1 1 1 
X x -a 'K-a 

而且 A 的对应于;^...，又„的特征向量是 B 的对应于上面这些特征值的特征向量 （见 习题 15 和 
16 .) 

例如，假设 a 更接近1而不是其他特征值，那么 1/(1 - ce ) 将是 B 的严格主特 征值. 假如 a 确 
实接近于1，那么 1/(1- a ) 比 B 的其他特征值要“大”得多.几乎对所有选择的 X 。，逆幂法会 
快速逼近1，下列算法给出了详细步骤. 


X2= 丄如 , = 去 [ 8 ] = [ 1_ | 

Ai, 8[l.8j [0.225J 

知 =[6 5][ 1] = p5l 

[1 2 \ [0.225J [1.450」 〆 

乂用1/吣倍乘 /U 2 得到 x 3 , 一直重复做下去，用 MATLAB 计算的前5次迭代结果列在表 5-2 中. 

表 5-2 例2的幕算法 



估计4的特征值 A 的逆幂法 

1. 选择一个非常接近于又的初始值 a . 

2. 选择一个最大分量为1的初始向量 X 。. 
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3. 对 fc =0， l ， …， 

a . 从 （ A - a/h = A 解出力. 

b . 设 A 4 是:^绝对值最大的分量. 

c . 计算 h =a + ( l / n k ). 

d . 计算 X / i+i = ( l / li / i )}*. 

4. 几乎对所有选择的 x 。， 序列 { vj 趋向于4的特征值; I ，而序列04趋向于对应的特 
征向量. 


注意， B 或者是 04- or / 广并没有出现在算法中.在求序列的下一个向量时并没有计算 
( A - al ) ' x k ,而是通过解方程 04- a /)_ y t = jc t 来得到 h 的（然后用倍乘 R 来产生 jc t+1 ). 因为 
对每个 一定可以从该方程解出力，故 4- ct / 的 LU 分解式将加快计算过程. 

例3在某些应用中，通常需要知道4的最小特征值，也需要对该特征值作粗略的估计.设 
2.1, 3.3 和 1.9 是下列矩阵4的特征值的 估值. 求最小特征值，小数位精确到6位. 

10 -8 -4' 

A = -8 13 4 

-4 5 4_ 

解两个最小特征值看起来很接近，因此我们对 4-1.9/ 应用逆幂法 • MATLAB 的计算结果 
列在表 5-3 中.这里的 at 。 随机选取， 04-1.9/)— 、，沁是 b 的最大分量， v * =1.9 + 1/^, 
x k + l =(\/^ k ) y t . 可以看到，初始的特征值估计得非常好，逆幂法产生的序列收敛很快，准确的 
特征值是 2. _ 


表 5*3 逆幕法 



于零而不是其他的特征值，那么这种取值是合理的. 

对很多简单的情况，本节给出的两个算法是实用的，它们为特征值估值问题提供了人门知 
识.另一个更全面和广泛使用的迭代算法是0?算法.比如， MATLAB 的命令 eig ( A ) 的核心是 
0?算法，这个命令能快速计算出4的特征值和特征向量.在 5.2 节的习题中对 g 況算法有过简 
短的描述，进一步的细节参见有关现代数值分析的教材. 
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. 练习题 

你怎样断定给出的向量 * 是矩阵 A 的某个特征向量的好的近 似值； 如果是，又怎样估计相应的特征 
值？用下面给出的矩阵 A 和 * 做练习. 



'5 8 4' 


* 1.0' 

A = 

8 3-1 

和 x = 

-4.3 


4-12 


8.1 


习题 5.8 

在习题1~4中，给出矩阵 A 和由幂算法产生 
的序列 {* W . 利用这些数据对 A 的最大特征值进 
行估计，并求出对应的特征向量. 

* - -[: ■， y ， t . 3158 ]，[ i 3298 ]， 


[-3.2 4.2 

「-0.26011 


S}[— 

lj [-0.252 0] 

- [o°：: oi(iy{r 87 i(r 57 i- 

[0.5188] 

- [r =J] ， U] ， U ]， 

o} [0.7502] 


5. ®A = 


0.749 
15 


向量 A 5 * 分 别是: 


pi r 31] r-i9ii r 991] r-^ 991] r 24991] 

24 lJ ， [-124 lJ ， [ 6 241」’ l _-3124 lJ 
寻找一个第 2 个分量为 1 且接近于 A 的一个特 
征向量的向量，保留4位小数.验证你的估值， 
并对 A 的主特征值进行估计. 




重做习题 5. 

[ M ] 习题7~12需要用到 MATLAB 或其他辅助 
的计算工具.在习题7和8中，利用幂算法及给出 
的*。，对 = 算出 {*,} 和 {/ M . 在习题9 

和10中，算出 / i 5 和 

[: 

:: ；卜： 

[8 0 121 


7. A -- 


8. A -- 


9. A ： 


1 


-2 


1 9 

1 9 

如果知道某个特征向量的近似值，就可以对特 
征值作另一估值，若 Ac = Ax ， 贝！ ] x t Ax = x t ( Xx ) 

= Hx T x ) ,瑞利商 R ( x ) = 等于 又. 假如; C 接近 

jr jr 

于; l 对应的特征向量，那么瑞利商就接近于; I .当 A 
为对称矩阵时 ( A T = A ) ，瑞利商及(;^) = (4八^)/41 
的精确数字大致是幂算法产生的倍乘因子沁的2倍， 
在习题11和12中通过计算队和及 ( x *)( it = l , …， 4) 来 
验证增加的精确度. 


2 ] ， Af0 = [ o ] 


-3 2 
2 0 


13. 对接近于4和 -4 但绝对值不同的特征值，幂 
算法还有效吗？ 
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14. 对接近于4和 -4 但绝对值相同的特征值，描 
述怎样才能得到估计接近于4的特征值的序列. 

15. 假设 Ar = A *， 数 Ct 不是 A 的特征值，令 
B = ( A - a /)-' ,在等式 = 的两边减去 
a * ,用代数方法证明 l / U - a ) 是 fl 的特征值， 

* 是其对应的特征向量. 

16. 设//是习题15矩阵 fl 的特征值， * 是对应的 
特征向量，即有（/1-«/厂'*=/«,利用这个等 
式求 A 的用//和 a 表示的特征值.（注 意：因 
为 fl 可逆，故 

17. [ M ] 设*。=(1，0,0),利用逆幂法对例3中的矩 
阵 A 的特征值 3.3 进行估值，计算精确到4位 
小数. 

18. [ M ] 设 A 为习题9给出的矩阵， jc 0 = (1,0,0) , 

利用逆幂法对 A 接近于 a = -1.4 的特征值进行 
估值，计算精确到4位小数. 

[ M ] 在习题19和习题20中，求 （ a ) 最大特 
征值， （ b ) 接近于零的特征值.设* 0 = (1,0,0,0)，在 
求特征值时，要求近似序列的计算精确到4位小数， 

练习 题答案 

对给出的 A 和 * , 

"5 8 4] (" 1.00] T 3.00' 

Ax = 8 3 -1 -4.30 = -13.00 

- .4 -1 2} 8.10 」 L 24.50 

如果 / U 近似于 * 的数倍，那么两个向量相应分量的比率也应该近似于某个常量，故计算： 

{ Ar 的元素 } + 的元素 } = { 比例 } 

3.00 1.00 3.000 

-13.00 -4.30 3.023 

24.50 8.10 3.025 

处的每一个分量大约是 * 对应分量的3倍，故 * 接近于 A 的特征向量，上面比例的任何一个都是特征值 
的近似值 .（ 若精确到5位小数，特征值是 3.024 09.) 

第5章补充习题 

在下列所有补充习题中， A 和 B 均为适当大 1. 判断命题的真假，给出理由. 

小的方阵. a •设 A 可逆且丨是其特征值，则丨也是 A - 1 的 


还包括近似特征向量的计算. 



21.—个常见的误 解是： 假如 A 有严格主特征值， 
那么对足够大的值，向量 A ** 近似于 A 的某 
个特征向量.对下面给出的三个矩阵，当 
* = (0.5,0_5)时，计算并研究 A * jc ，并试图得到 
一般结论（对 2 X 2 矩阵）. 



' 0.8 0 
0 0.2 




324 


第 5 章 


特征值. 


可逆 • 


b . 若 A 可通过行变换化成单位阵/ ,那么 A 可 
对角化. 

c . 若 A 的某一行或某一列上元素全为0,那么 
0是 A 的一个特征值_ 

d . A 的每个特征值同样也是 A 2 的特征值. 

e . A 的每个特征向量同样也是 A 2 的特征向量. 

f . 可逆矩阵 A 的每个特征向量同时也是 A — 1 的 
特征向量. 

g . 特征值必为非零标量. 

h . 特征向量必为非零向量. 

i . 对应同一特征值的两个特征向量必为线性相 
关的. 

j . 相似矩阵必有相同的特征值. 

k . 相似矩阵必有相同的特征向量. 

l. 矩阵 A 的两个特征向量之和仍是 A 的特征 
向量. 

m - 上三角矩阵 A 的特征值正好是对角矩阵 A 
中的非零元素. 

n . 将重数计算在内，矩阵 A 和 A T 具有相同的 

特征值. *' 

o . 如果 5 x 5 矩阵 A 的不同特征值少于5个，那 
么 A 不可对角化. 

P . K 2 中存在没有特征向量的 2 x 2 矩阵. 

q . 若 A 可对角化，那么 A 的各列线性无关. 

r . 一个非零向量不能对应于 A 的两个不同特 
征值. 

s . 方阵 A 可逆当且仅当存在一个坐标系使得变 
换 * ^ Ar 可以用对角矩阵来表示. 

t . 如果 K " 的标准基中每一向量~都是 A 的特 
征向量，那么 A 是一对角矩阵. 

u . 如果 A 相似于一可对角化的矩阵 fl , 那么 a 
也可对角化. 

v . 如果 A 和 B 均为 nxn 的可逆矩阵，那么 Afl 
相似于 flA . 

w . 具有 n 个线性无关特征向量的 „ x „ 矩阵 


X. 如果 A 是一 nxn 可对角化矩阵，那么 R " 中的 
任一向量均可表为 A 的特征向量的线性组合. 

2. * 是矩阵乘积 AB 的一个特征向量，且其0, 
证明是 flA 的一个特征向量. 

3. 设 * 是 A 的对应于特征值又的特征向量. 

a . 证明 * 是 5/- A 的一个特征向量，并求其对 
应的特征值. 

b . 证明 * 是 5/-3 A + A 2 的一个特征向量.并 
求其对应的特征值. 


4. 用数学归纳法证明如果; I 是 nxn 矩阵 A 的一个 
特征值， * 是其对应的特征向量，那么，对任 
一正整数 m , A " 是 A " 的一个特征值， * 是其 
对应的特征向量. 


5. p(t) = c 0 + Ci t + c/+- + c„t" ,定义 p ( A ) 为用 
对应的 A 的幂去 取代 〆 0中的每一个,的幂所 
得的矩阵（其中 = / ). 即 

p(A) = c 0 I + c t A + c 2 A 2 + ••• + 

若 A 是 A 的一个特征值，证明 p ( A ) 的一个特征 
值是 p ( A ). 


6. = 是 2 x 2 矩阵， 



a _ 设 fl = 5/-3 A + A 2 . 证明 fl 可通过寻找 fl 的 
一个合适的因式分解来化成对角矩阵. 


b . 已知 p (0 和 〆 A ) 如习题5所述，证明 p ( A ) 可 
对角化. 


7.设 A 可对角化且 〆 0是 A 的特征多项式_定义 
P ( A ) 如习题5所述，证明 p ( A ) 是零矩阵.这一 
事实，叫做 Cayley - Hamilton 定理，它对任一方 
阵均成立. 


8. a . 设 A 是一 nxn 的可对角化 矩阵. 证明当特征 
值又的 重数是 n 时，有 A = ； l /. 

b •利用 （ a ) 来证明矩阵 A = 不可对角化. 


9. 证明： 当 A 的所有特征值均小于丨时， /- A 可 
逆 .（ 提示： 如果 /- A 不可逆情况会是怎样？） 
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10. 证明： 若 A 可对角化，且 A 的所有特征值均小 
于1,那么当 / t 4 oo 时， A * 趋于零矩阵.（提 
示： 考虑 A 、， 其中 * 为/的任一列 .） 

11. 设 u 为 A 的对应于特征值； I 的特征向量， H 为 


IT 上过 u 和原点的直线. 
a . 证 明：对 上任一 * ,有 Ac 在上，那 
么《在 A 内不变. 


b . 设 A ： 为 R " 上恒定于 A 内的一维子空间，说 
明： A ： 包含 A 的一个特征向量. 

12. 设 G = .利用 5.2 节中求行列式的公式 


( 1 ) 证明 detG = ( detA )( detfl ). 由此，推导出 G 
的特征多项式为 A 与 fl 的特征多项式的乘积. 
利用习题12求下列矩阵的特征值. 


"3 -2 8' 

13. A= 0 5-2 

0-^3 


14. A = \ 


"15-6 -1 
2 4 5 2 

0 0-7-4 


.0 0 3 1 


15. 设 •/ 为元素值全为 1 的 /jx/i 矩阵，并设 


A = (a~b)I + bJ 


即 A = | 


abb- b 
b a b … b 
b b a ••• b 


，利 


办办… a 」 

用第 3 章补充习题 16 的结果证明 A 的特征值为 
a ■^和 + 办.并求这两个特征值的重数. 


[12 2 ' 

16. 应用习题15的结论求矩阵 2 1 2 和 
2 2 1 


3 3 7 3 3 的特征值 . 

3 3 3 7 3 

3 3 3 3 7 

17. 设 4 = [^ 回顾 5.4 节习题 25 中的 trA 

L fl 21 Cl 22 ] 


( A 的轨迹）等于 A 的对角元素之和.证明 ： A 
的特征多项式为又 2 -( trA)A + detA _ 然后证明 
一 2 x 2 矩阵 A 的特征值全为实数当且仅当 

deU ^(^) ' 

18•设 A = ^ . 说明当 /t 4 oo 时， 

a 中 

[1.0 1.50」 

习题19~23是关于特征多项式 = + 郎 

+ -. +〜_广 | +广和 nxn 矩阵 C p 的， C p 叫做 p 的友 


矩阵： 

" 0 1 0 ... 0 

0 0 1 0 

C P = ' : 

0 0 0 1 

-a 0 -a { ~a 2 ••• —a n -i 

19. M 0 = 6_5/ + r 2 , 写出它的友矩阵<^，并求 C p 
的特征多项式. 


20.设 〆 /) = (/- 2)(/ -3)(， 一4) = -24 + 26/ - 9/ 2 +/ 3 , 
写出 〆 0的友矩阵，并用第3章的方法求它的 
特征多项式. 


21. 利用数学归纳法 证明： 时， 

det ( C p - A /) = (-1)" (a 0 +a t X + -- + + A ") 

= (- D >( A ) 

(提 示： 求沿第一列展开的余子式，证明 
det ( C 厂; U ) 具有（-又) + 的形式，其中 

fl 为某一多项式 （ 由归纳假设 ）.） 

22. 设 〆 /) = a 0 +即+似 2 +/ 3 ，并设 A 是 p 的一■个 
零点. 


a - 写出 p 的友矩阵. 

b . 证明又 3 =- a 。- 两又 - M 2 及 （1， A ， 又 2 )是 p 
的友矩阵的一个特征向量. 

23. 设 p 为习题 22 中的多项式，并假设方程 
〆 /) = ()有不同的根; . 设 V 为范德蒙 
' 1 1 1 ' 

德矩阵 V = & A , ^ .( V 的转置在第2章 

.m 
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补充习题11提及 .） 利用习题22和本章中的 
定理推导 V 是可逆的 （ 不要计算 V - 1 ). 然后 
说明是一个对角矩阵. 

24. MATLAB 命令 roots ( p ) 是用来计算多项式方程 

= 0 的根的.阅读 MATLAB 手册，阐述 
roots 命令所用到的算法的基本思想. 

25. [ M ] 如果可能的话，利用矩阵程序对角化矩阵 

"-3 -2 0' 

4= 14 7 -1 . 利用特征值命令创建对 

-6 -3 1 


角矩阵 £>. 如果程序有产生特征向量的命令， 
利用此命令产生的向量来构造可逆矩阵 
然后计算 AP - PD 和 PDP - 1 . 并讨论结果. 

-8 5 -2 0' 

-5 2 1-2 
10-8 6-3 

3-210 


26. [ M ] 设 


重做习题 25. 



第 6 章正交性和最小二乘法 


介绍性实例重新整理北美地质数据 


设想启动一个巨大的工程，该工程估计持续10年时间， 

需要花费大量的人力去构造并计算一个1 800 000 x 900 000 
的线性方程组.这实际上就是美国地质调査局 （ NGS ) 1974 

年所做的工作.当时准备更新北美地质资料 （ NAD ) - 

个包含268 000个仔细测量并标记说明的地点网络，它覆盖 
整个北美大陆，包括巴拿马地峡、格陵兰岛、夏威夷、维尔 
京群岛.波多黎哥和其他加勒比海诸岛. 

北美地质资料中记录的经度和纬度范围必须精确到几 
厘米，其原因是它构成诸如测量，地图，法定边界，国家和 
区域土地使用计划，像高速公路和公共使用线路等国内工程 
项目的设计等方面的标准.从上次1927年地名测量调整以 
来，至少需要在原始资料中增加200 000个新观测点，误差 
会随时间流逝而不断积累，并且在某些区域，地球板块以每 
年5厘米的速度漂移.到1970年，重新检査资料系统的工 
作已经十分迫切.而且新计划准备选取新的参考观测点. 

覆盖长达140年的数据资料必须转化为适合计算机运算的格式，且数据本身需要标准化（例如，地 
球地壳运动的数学模型，数年前被用于更新测童加利福尼亚的圣安德里亚断层）.此外，测量需要交叉检 
测以确定误差来源是原始数据或是输人计算机的输人错误.最后的计算包括180万个观测值，每个值的重 
要性又依赖它的相对精度且涉及一个方程. 

通常意义下，北美地质资料对应的线性方程组没有正常解，只具有最小二乘解.它用经度和纬度表示 
参考点以逼近180万个实际观测点.通过对应线性方程组的法方程解出最小二乘解，实际计算包含 
928 735个方程、928 735个变量！ G 

由于得到的法方程对当时的计算机来说规模实在 太大. 他们通过 Helmert 分块的技巧将方程组分成 
小块，将系数矩阵递推分割成越来越小的块，最小块对应的方程组在北美资料中覆盖地理上邻近的 
500〜2000 个参考点，图 6-1 显示美国如何被分成 Helmert 块，经过几个中间步骤，小块系统的解最后产 



© 有关 Helmert 分块技巧的数学讨论和整个 NAD 项目的详细内容，出现在 North American Datum of 1983, Charles 
R.Schwarz(ed.)，National Geodetic Survey, National Oceanic and Atmospheric Administration (NOAA) Professional 
Paper NOS 2, 1989. 
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生整体928 735个变量的所有解. 



图 6-1 美国 Helmert 分块的邻接边界 


直到 1983 年才完成北美资料数据库的更新.三年以后，通过更深人的分析和 940 小时的计算机计算， 
人类历史上曾经完成的数目最大的最小二乘法问题被完全解出. 

实验数据中产生的线性方程组 Ar = A 通常无解，例如上面的实例.通常可接受的替换解是向量 i , 
它使得 At 与 ft 之间的距离尽可能小 . 6.1 节给出的距离定义是平方和，期望解 i 被称为 At 的最小二乘 

解. 6.1-6.3 节给出正交性和正交投影等基本概念，这些概念将在 6.5 节中用于求解 i . 

在线性代数的数值计算中，经常用到矩阵分解的技巧， 6.4 节给出正交投影的另一个应用.本章剩余 
部分给出的最小二乘问题的应用实例，包括比 R " 空间 更一般 的向量空间，但对所有问题都限制在实数范 
__ »»»» 

6.1 内积、长度和正交性 

大家已经熟悉了二维和三维空间中的长度.距离和垂直等几何概念，本节类似引人 IT 空间 
的定义，这些概念为解决实际问题 （ 如上面提到的最小二乘问题 ） 提供了有力的几何工具.而] [{■ 
中的三个新概念都建立在两个向量的内积基础之上. 

内积 

如果《和1^是 R ” 空间中的向量，可以将 B 和 V 作为 „ xl 矩阵.向量矩阵 U T 是1)<„矩阵且矩 
阵乘积 《 T V 是一个 1X1 矩阵，我们将其记为一个不加括号的 实数. 如 《 T v 称为的内积，并 
记作 U . V . 这里的内积，曾在练习 2.1 提到过，也称为点积.如果 
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那么的内积定 义为： 
[Ml 


wj 


= UiVi+U 2 V2+--* + W n V n 






' 3" 

例1 

如果 

-5' 

， V = 

2 



_-1_ 


-3 


计算和 1 


'=[2-5-1] 


I - v T « = [3 2 -3] 


:⑵⑶ + (-5)(2)+ (-1)(-3): 


= ⑶⑺十 (2)(-5)+ (-3)(-1) = - 


■ 

从例1中的计算明显看出， u V = V U. 一般情形下，内积成立交 换律. 下面关于内积的性 
质，可以很容易用 2.1 节中的矩阵转置运算来验证（见本节末习题21和 22) • 

定理1设 V ， M 和 VV 是 R " 空间中的向量， c 是一个数，那么 

a . « v= v u. 

b. (u+v)-w =u w+v w . 

C . ( CM ) . V = c(u . V ) = M . (cv). 

d . M M ^ 0, 并且 M.M = 0 成立的充分必要条件是《=0. 

性质 （ b) 和 （ C) 可以合并为以下 法则： 

(c,«, + ••• + c i ,« p ) w =c,(«, -w) + ■■■ + c p (u p w) 

向量的长度 

如果 V 是属于 ir 的向量，其分量为 V ,，…， v „, 因为 v . v 是非负数，那么 VV 的平方根有意义. 


定义向量 V 的长度 （范 数）是非负数 ||v ||, 定义为 

||v|| = Vv -V = +v| + --- + v „ 2 且 |v| 2 =v.v 

假若 V 是 R 2 中的向量，且如果我们将 V 与平面上的点 ( a , fc ) 相对应，那么 || v || 的值 
和平面内原点到点 V 的线段长度一致，这个结论可以从勾股定理和图 6-2 中的三角形直接 得到. 
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类似长方体的对角线计算，三维空间中向量 | v || 的长度 
和通常意义下的长度概念是一致的. 

对任意数 c ， 向量 cv 的长度等于 | c | 乘 v 的长度，即 

IHhHIMI 

( 为验证上式，计算 || cv || 2 =( cv ) ( cv ) = c 2 v-v = c 2 || v | 2 , 

然后作开方运算就可以得到以上结论 .） 

长度为1的向量称为单位 向量， 如果把一个非零向量 
除以自身的长度，即乘#1，就可以得到一个单位化的向量， 

量 K 的过程，称为向量 V 的单位化，且此时 K 和 V 方向一致. 
下面用简约形式 （ 即行向量形式）计算几个例题. 




图 6-2 II-II 作为长度的几何意义 
«=| j ^|. 这种把向量 v 化成单位向 


例2若 v = ( l ,-2,2,0) ,找出和 v 方向一致的单位向量 n . 

解首先计算向量 v 的长度 

IHI 2 = v • v = ( I ) 2 + (-2)2 + (2) 2 + (0) 2 =9, || v | = V 9=3 

对 v 乘^得到 

IMI 



1' 


1/3" 

1 1 1 

-2 


-2/3 

H V = 3 V = 3 

2 

0 


2/3 

0 


(|,1)生成，求出一个单 


为验证||«|| = 1,只需验证 ||« f = l . 

iHr=««=(|) 2 +(-|) 2 +(|) 2 +(0) 2 =i+|+4+o= 

例3设 W 是 R " 的子空间且由向量 ~ 

位向量 z 且 z 构成 W 的一个基. 

解空间 W 包含所有 x 数倍的向量，如图 6-3 a 所示. W 中的 
任意非零向量都是 W 的基.为简化计算，重新“标度” x 以消去分 

数，即向量 x 乘3得到现在计算 ||jf =2 2 +3 2 =13， 
|卜|| = Vl 3. 把向量 j 单位化 可得： 

「if 

见图 6-3 b . 另外一个单位向量是 (-2/-3/ n /13) 


y 


士 _3 = 


图 6-3 把一个向量单位化， 
得到一个单位向量 
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R " 空间中的距离 

接下来描述一个向量如何逼近另一个向量，注意，如果 a 和 b 是实数，在数轴上 a 与 b 的距 
离是 |a-fc|， 图 6-4 给出两个实例.用类似 R 中两个数间的距离定义『空间中两个向量的距离. 


h 6个单位 | | | | 7 个单位 | | 

I2-8H-6I=6 或 I8-2W6N6 |(-3)-41=1-71=7 或 14-(-3)1=171=7 

图 6-4 R 中两个数的距离 

定义 R ” 中向量 a 和 v 的矩•离， 记作 dist ( a ， v ) ，表示向量 a - v 的长度，即 
dist ( M ， v ) = | w - v || 

对 R 2 和 R 3 空间，如例4、例5所示，距离的定义和欧几里得空间中两点的距离公式一致. 
例4计算向量《 = (7, 1) 和 v =(3, 2) 之间的距离. 

M 先计算 k _ v = [ L [ J ]， 则有 |«-»^4 2 +(-1) 2 =7^. 

向量 K， V和 H-V 如图 6-5 所示，向量 K- V加上向量V的结果是向量 K. 注 意到图 6-5 中的 
平行四边形表明，从向量《到1>的距离与向量 M -V 到0的距离相等. 



图 6-5 向量《和”的距离等于 《- v 的长度 ■ 

例 5如果 M 2 , M 3 ) 和 vyv ,， V 2 , V 3 ) ，那么 

dist(«, v) = |«-v| = yj(u-v) (u-v) = y /( u , - v ,) 2 + ( u 2 - v 2 ) 2 + ( u 3 - v 3 ) 2 ■ 

正 交向量 

本章以下内容阐述这样的事实，即欧几里得空间中的直线垂直 
概念可以推广到 R" 空间. 

考虑 R 2 或 R 3 空间中，通过原点且由向量 K 和向量V确定的两 
条直线，两条直线（见图 6-6) 几何上垂直当且仅当从《到V的距 
离与从 K 到 -V 的距离相等，这等同于要求它们距离的平方要相等. 

现在 计算： 



图 6-6 
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[dist(u, -v)P =|n-(-v)|| 2 =||a+v| 2 
= ( b + v )-( b + v ) 

= b ( b + v )+ v («+ v ) 定理 1( b ) 

= U U + U V+V U + V V 定理 1(a) 、（ b) 

= ||«|| 2 +|v| 2 +2«v 定理 1(a) (1) 

同样将 - v 换成 V 的计算 如下： 

[dist(H,v)] z = |u|| 2 +||-v| 2 +2u •(-!>) 

= ||u| 2 +||v| 2 -2a-v 

两个距离平方相等的充分必要条 件是： 2 u-v =- 2 u v 或 u. v = 0. 

这里的计算表明，当向量 B 和向量 V 看作几何点时，通过这些点和原点的两条直线相互垂 
直的充分必要条件是 ||. V =0. 

下面给出 R ” 空间中两个向量互相垂直的一般定义（或正交，这是线性代数中的一个通用术语）. 

定义 如果 U.v=0 ， 则两个向量 B 和 V 称为 （相互）正交的. 

由 0 T •»« =0 对任意 V 都成立，可以得出零向量与任意向量正交. 

关于向量正交的一个重要性质由下面的定理给出，其证明可以从上面正交性定义和 （ 1 ) 中 
的计算立刻推出.图 6-7 的直角三角形给 出长度 的直观描述. 

定理2 (毕达哥拉斯（勾股） 定理） 

两个向量 tt 和 v 正交的充分必要条件是 ||«+ v || 2 = | Bf + | vf . 

正交补 

为了提供内积概念的相关练习，我们引人一个在 6.3 节和其余章 
节都需要的概念.如果向量 z 与 R ” 的子空间 W 中的任意向量都正 
交，则称 Z 正交于 W . 与子空间 VV 正交的向量 z 的全体组成的集合称 
为 W 的正交补，并记作读作 W 正交补）. 

例6设 W 是 K 3 空间中通过原点 O 的平面， L 是通过原点且与 iv 正交的直线.如果 2 和 iv 
都非零， z 在直线 L 上且 iv 在空间 W 内，那么从0到 z 的线段正交于从0到 iv 的线段，即 z . w = 0， 
见图 6-8. 从而/■上的每个向量与 W 中的任一向量都正交.事实 
上，/■包含所有与空间 W 中的向量 w 都正交的全体向量，空间 W 
包含与 L 中向量 Z 都正交的全体向量，也就是： 

L = 且 1^ = 1丄 ■ 

若 W 是 R ” 的子空间，下面两个关于的性质，会在以后的 
章节用到，证明放在习题 29 和习题 30 中，习题 27~31 将给出几 
个复习内积性质的练习. 



图 6-8 —个作为正交补空间 
的平面和通过原点的直线 
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1. 向量 I 属于的充分必要条件是向量 x 与生成空间 W 的任一向量都正交 ■ 

2. 是 R ” 的一个子空间. __ 

下面的定理和习题31验证了 4.6 节关于子空间的论断，见图 6-9 ( 参考 4.6 节的习题28 ) 


° ^ ^NuTA NulA ^ M ^ 0 


图 6-9 —个由 mxn 矩阵 A 确定的基本子空间 


定理 3 假设是 mx n 矩阵，那么 A 的行向量空间的正交补空间是 A 的零空间，且的 
列向量空间的正交补是 ，的零空间： 

( RowA) a = NuM JL (0)1>1>丄=1^1， 

证计算 Ac 的行列法则表明，如果 x 是 NulA 中的向量，那么向量 x 与 A 的每一行（将行 
作为 R ” 空间中的向量）正交.由于 A 的行生成行空间，向量 x 与 RowA 正交.反之，如果 x 与 
Row / I 正交，那么 x 当然与 A 的每一行正交，因此办= 0,从而证明了第一个结论.如果将/\换 
成并利用 Row^ T =ColA , 可以用第一个结论的证明得出第二个结论. ■ 

R 2 空间和 R 3 空间的角度（可选内容） 

如果《和》>是 IR 2 或 IR 3 中的非零向量，那么可以用内积，将从原点到点 b 和原点到点 v 的两 
个线段之间的夹角联系起来，对应的公 式是： 

u v =J|u| j|v||cos]9 ( 2 ) 

为了验证 K 2 中的向量公式，考虑图 6-10 所示的三角形，其边长分别是 || U ||，| V || 和 || U - V ||, 
由余弦定理 可知： 

||«-v| 2 =H| 2 +||v| 2 -2||o| IHIcos!? 

可以重新组合上面的内积表 达式： 

H |H|cosi?=i[|(iiK 2 + |vj| 2 -\\u-vf] 

=金[“| 2 +u i + Vi 2 + v | — («| — V|) 2 — («2 — V 2 ) 2 ] 

= M | V , +U 2 V 2 

=uv 

R 3 空间的情形可类似验证.当 n >3 时，公式（2> 可用于定义两个向量之间的 夹角. 例如， 
在统计学中， （2) 式中对向量 B 和 v 定义的 COSl > 的值就是统计学家所称的相关系数. 
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图 6-10 两个向量之间的夹角 


练习题 



1. 计算0和 

a a \a a ) 

2. 计算向量 c 方向的单位向量 u . 

3. 证明向量 rf 和向量 c 正交. 

4. 利用练习题2和3的结果，解释为什么 rf —定正交于单位向量 

习题 6.1 


在习题1~8中，利用下列向量计算 数值: 



:和^ 


5 . ㈣ V 6. (^)， 

7. IHI 8- M 

在习题9~12中，计算给定向量方向的单位向量. 
_ 「-301 


40 」 


13. 计算向量. 


=与向量 = 之间的距离. 
-3 」 [-5 


14. 计算向量《 = 

' 0' 

-5 

与向量 Z = | 

-1 


_ 2_ 


8_ 


之间的距离. 


在习题15~18中，确定哪一对向量相互正交. 


「 8 1 »•「一 2 1 

I= [-5j' 叶 3 」 



' 3' 


■-4' 


-3' 


1 ' 

17. u = 

2 

-5 

, v = 

1 

-2 

18. y = 

7 

4 

, z = 

-8 

15 


0 


6 


0」 


-7 


在习题19~20中，所有向量在 IT 中，说明每 
个命题的真假，并验证你的答案. 

19. a . v-v = || v || . 


b . 对任意数 £•， u - ( cv ) = c(u - v ) 

c . 如果向量 U 到向量 V 的距离等于向量 U 到向 
量 -V 的距离，那么 U 和 V 是正交的. 

d . 对于一个方阵 A , Col A 中的向量与 NulA 
中的向量正交. 
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e . 如果向量 v ,, …， v , 生成子空间且向量 
: C 与每一个 v,_(i = l , …, P ) 正交，那么向童: t 
属于 IVi . 


b . 对任意数 c , || cv || = c H - 

c . 如果 x 与子空间 IV 中的任一向童正交，那 
么*是灰1中的向童. 

d . 如果 ||«f + || v|f =||« + v || 2 ,那么 B 和 V 相互 
正交. 

e . 对任意 mxn 矩阵 A . A 的零空间中的向量 


与 A 的行空间的每个向量正交. 

21. 利用内积的转置定义，验证定理丨中的 （ b ) 
和 （ c ), 注意第2章的一些内容. 

22. 假若 《 = («i,m 2 ,m 3 ) ,解释为什么 b_b 》 0, 什么 
条件下« « = 0? 



2 


-7* 

23. 假若 a = 

-5 

-1 

和 v = 

-A 

6 


计算和比较 《 v . 


HI 2 , flvf 和 |« + v | J . 但不能使用勾股定理. 


24. 证明 R " 空间中向量《和》>的平行四边形法则. 

|« + vf + fl«-tf =2|«| 2 +2 |*f 

25. fg ® v =^ J . 描述与 vJE 交的向的集合 
W ■(提示：考虑 v =0, v 矣❶两 种情形 .） 

26. 假设《 = 且 IV 是 M 3 中满足《.*=0的向 


量 jc 全体，第4章中的什么定理可以说明灰是 
硭的子空间？用几何语言描述空间 IV . 

27. 假若一个向量与向量《和* ■都 正交，说明 j ； 
与向量 《 + v 正交. 


28. 假若与向量《和 v 都正交.证 明少与 
Span {«, v } 中的任一向量正交.（提示： 
Span { u , v } 中的向量 w 具有形式 w = c,u + c 2 v . 
说明与向童 w 正交 .） 



0 

29. 假若 W ^ Spanfv ,, …, V ,} . 证明： 如果 x 和每个 
Vj ( l ^ j^p ) 正交，那么与 IV 中任一向 
量正交. 

30. 假若 IV 是 K " 的子空间，且是所有与 IV 正 
交的向童集合，利用下列步骤说明是 K " 的 
子空间. 

a . 选取灰 1 中的 z , 且《表示 IV 中任意元素， 
那么 z .« = 0. 取任意数 c , 然后证明《与 
向量《正交（由于 u 是 VV 中的任意向量， 
这说明 czSiv 1 中） • 

b . 选取 zi 和 z 2 在 W ' 1 ■中，且 k 是 IV 中任意元 
素，验证向量2,+&与《正交，则可从 
Z, + Z 2 中得出什么结论？为什么？ 

C. 最后证明 IV 1 是 R " 的子空间. 

31. 证明： 如果 * 是属于空间 IV 和 IV 1 的向量，那_ 
么*=0. 

32. [ M ] 构造 K 4 的任意一对向量《和*>, 假若： 

0.5 0.5 0.5 0.5' 

A _ 0.5 0.5 -0.5 -0.5 

~ 0.5 -0.5 0.5 -0.5 

0.5 -0.5 -0.5 0.5 

a . 记 A 的列向量为 ai ,"., fl4 , 计算每一列的长 
度和 H a , «3, fli a , , a 2 « 3 , a 2 a A , 

«3 ««- 

b . 计算并比较和 A «, v 和 Av 的长度. 

c . 利用方程 （2) 计算向量《和》>夹角的余弦 
值， 并将此值和向童4«和办夹角的余弦 
值相比较. 

d . 对任意两个向量，重复步骤 （ b ) 和 （c ), 从 
A 对任意向量的作用可以得出什么 猜想？ 
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[ M ] R 4 中分量是整数的任意向量 ; r , _ y*v 


-6 

3 

-27 

-33 

-13' 

(且 v *0 ), 计算下列各量： 


6 

-5 

25 

28 

14 

阶，(卦’ ^ - ^ 

34. [ M ] 设火= 

8 

-6 

34 

38 

18 


12 

-10 

50 

41 

23 

选取新的任意向量 JC 和重复上面计算，从 


14 

-21 

49 

29 

33 - 


映射 jr = (对可得出什 

么猜想，用代数证明你的猜想. 

练习题答案 

1. a b = l ' a a = 5 ,因此，|^ = 1,且 

2. 先倍乘 C ,乘3得到 _y = 


构造 


矩阵 W 使其列是 NulA 的一组基，构造矩阵/? 
使其行是 Row A 的一组基（见 4.6 节）.用 W 和 
/?执行矩阵计算来说明定理3的结论. 


-14/5 

7/5 


，计算 |) f =29 和 | y | = #. 与向量0和少方向一致的单位向量是: 

“會 


4/ V 29 

-3/ V 29 

2/ V 29 


d 与 c 正交， 因为： 


'4/3 


= f-6 十 0 


4. 3与《正交，因为向量《具有形式知，且对任意灸， 

d u=d (kc) = k(d c) = k(0) = 0 

6.2 正交集 


R " 中的向量集合{“，，…，心}称为正交向量集，如果集合中的任意两个不同向量都正交即 
当 时， u rUj =0. 

例1证明是一个正交集，此处 



Y 

1 

r-i" 


'-1/2* 

Ml = 

1 

,«2 = 

' 2j 

， “3=| 

-2 

1 

1 



l 

7/2 


解考察三种可能的不同向量对’即 

«1«2 =3(-1)+ 1(2)+ 1(1) = 0 
«, « 3 =3(-1/2) + 1(-2) + 1(7/2) = 0 
«2 « 3 =-1(-1/2) + 2(-2) + 1(7/2) = 0 
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每对不同的向量是垂直的，所以{«,，《 2 ,« 3 }是正交集，如图 6-11 中的三条线段，它们之间 
相互垂直. 



定理4如果是由 K " 空间中非零向量构成的正交集，那么 S 是线性无关集， 
因此构成所生成的子空间 S 的一组基. 

证如果 0 = Cl « 1+ ." + Cp « p 对任意 数 £1 ，…而成立，那么 
0 = 0 a , = ( c , a , + c 2 u 2 + ... + c p u p )' U x 
= ( c , a ,)- a , +( c 2 a 2 )- a , + ••■ + ( c p a p )- a I 

= C ,( a , .味）+£：2(*«2 .味）+ ... + £^(〜.岣） 

= c,(ai a,) 

因为 K , 非零，且 K , 与 K 2 ,..., K P 正交，由非零得到 £| =0.类似可得0 2 ，…， Cp 为零，从而 
得到 S 是线性无关集. ■ 

定义 R " 中子空间 W 的一个正交基是 IV 的一个基，且是正交集. 

下面的定理表明正交基比其他基优越，线性组合中的权值较易计算. 

定理5假设{私，…，!^}是 R " 中子空间 W 的正交基，对 W 中的每个向量 J ， 线性组合 
… + C p K p 中的权值可以由 C ; = y Uj (j = l ,---, p ) 计算. 

U J U J 

证像前面证明一样，正交集 {«, ，…， 《 p } 表明 

y ^x ~ (Ci«i + C 2 u 2 十…+ 心心）.〜 =c,(a, -a,) 

由于，非零，从上面方程中可以解出系数 Cl ， 若计算广 … (y = i ,2, …，；；），可求出系数 c ;. 

■ 

' 6 ' 

例 2例1中的集合 5={ Kl ， a 2 , a 3 } 是 R 3 中的一个正交基，将向量1表示成 S 中向量 

—8 

的线性组合. 
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解 计算 

y u x =11 y u 2 = -12 y u 3 = -33 

m , m , =11 u 2 u 2 =6 u, u, =33/2 

由定理 5 得 



=u, -2u 2 -2m 3 ■ 

注意到，由正交基构成的线性表示， J 的权值十分容易计算.如果基不是正交的，则必须 
类似第1章解线性方程组才能得到. 

下面我们构造一个非常重要的步骤，涉及许多包含正交计算的问题，而且它会对定理5给 
出一个几何解释. 

正交投影 

对 R " 中给出的非零向量《，考虑 R " 中一个向量 j 分解为两个向量之和的问题，一个向量 
是向量《的数量乘积，另一个向量与《垂直.我们期望写成 

y = y+z ( 1 ) 

其中 f =0! K ， a 是一个数， z 是一个垂直于 K 的向量，见图 6-12. 对给定数 a ， 记 z = ： y -0! K ， 
则方程 （1) 可以满足，那么: y - j ^和《正交的充分必要条件是 

0 =(少 - au ) u = y u -( au ) u = y u - a(u u ) 

也就是满足方程 （1)， 且 2 与《正交的充分必要条件是 a = U 且$ = 向量 j * 称为： >>在《 

u u U.U 

上的正交投影， 向量 Z 称为^ 垂直《的分量. 



图 6-12 求 a 使正 交于“ 


如果 C 是非零数，且在 j * 的定义中用 C « 代替《，那么: y 在⑶上的正交投影和3>在《上的正 
交投影完全一致（习题31 )，因此这个投影可由《向量所生成的子空间 L ( 经过《和原点的直线） 
所确定.有时用 proj t 3 > 来表示 j ! ，并称之为 : y 在 b 上的正交投影 ，即 

j = proj i 3 , = — « (2) 

UU 

例 3假设3> = U 和《 = ，找出在《上的正交投影，然后将}写成两个正交向量之和， 
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一个在 Span { a }， 另一个与 a 正交. 


解 计算 

则 j 在 a 上的正交投 影是： 

J 垂直于《的分 量是： 

两个向量之和为 j ， 即 



y y (y-y) 

向量^的分解可表示为图 6-13. 注意： 如果上面的计算正确，那么 { u - j !} 是正交集.作 
为检验，计算 


，七 -，)=[ m =_8+8 =o 
4 」 L 2 



由于图 6-13 中连接 jy 与 j ； 的线段垂直于 I ，由 j ； 的构造可知，标记为 j ! 的点是距离 L 的 
最近点.（这可用几何方法证明，这里我们假设 R 2 中成立，在 6.3 节给出 IT 情形的证明 .） 

例4计算图 6-13 中从到 L 的距离. 

解 从3>到1的距离，是从 j 到正交投影垂直线段的长度，这个长度等于 j * 的长度，从 
而距离为 

||j-j|| = Vn7+2 r = V5 ■ 
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定理5的几何解释 


(2) 式中正交投影 i 的公式和定理5中每一项形式一致，这样，定理5将向量 j 分解为一 
维子空间上正交投影之和. 

对于 VV = R 2 = SpanK , i / 2 l ， 叫和 a 2 相互正交的情形，很容易看到分解式，对任意 K 2 中的 
向可以 写成： 


(3) 


(3) 中的第一项是>在子空间 Span {«,} 上的投影（通过原点和的直线），第二项在子空 
间 Span 彳 i / 2 1上的投影， （ 3 ) 式将少表示为 由妁和 确定的 （ 正交）轴上的投影之和，见图 6-14. 



图 6-14 —个向童分解为两个投影之和 

定理5将 Span {«„. 中的每一个少分解成， p 个相互正交的一维子空间上的投影之和. 
一个力分解为力的分量 

如果某一力施加到一个物体上，在物理上可能出现图6-〖4的分解，通过选取合适的坐标系 
统，一个力可以表示为 R 2 或 H 3 中向量常常这类问题包含某些特别感兴趣的方向，可表示 
为另一个向量例如，一个在水平方向移动的物体被施加外力后，用向量1/表示移动的方向， 
见图 6-15. 一个关键问题是将力分解为《方向的分量和与“正交方向的分量，具体计算类似于 
上面已完成的例 3. 



图 6-15 
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单位正交集 

集合{«,，…， 《 P } 是一 个单位正交集 ，如果它是由单位向量构成的正交集.如果 W 是一个由单 
位正交集合组成的子空间，那么 {«, ，…， 《 p } 是 W 的单位正交基， 原因是这类集合自然线性无关， 
见定理 4. 

最简单的单位正交集合是 R" 中的标准基 { Cl ，...， e „}， 任何集合 { Cl ，…， e„} 的非空子集也是单 
位正交的，下面是一个更复杂的例子. 

例 5证明 {«,，《 2 ，《 3 } 是 R 3 的一个单位正交基， 其中： 



a; 


-1/V6 - 


'-1/V66 

Vi = 

i/n/TT 

V 2 = 

2/V6 

v 3 = 

^/V66 


i/n/hj 


1/V6J 

i 

7/V66 


解计算 

v,v 2 =-3/766 + 2/766+1/766=0 
v,v 3 =-3/V726-4/V726 + 7/V726=0 
v 2 v 3 =1/7396 -8/V396 + 7/V396=0 
从而 {VuV^Vi} 是一个正交基，另外 

v,-v, =9/11 + 1/11 + 1/11 = 1 
v 2 .v 2 =1/6 + 4/6 + 1/6 = 1 
v 3 v 3 =1/66 + 16/66 + 49/66 = 1 

从而证明 v,，v 2 *v 3 是单位向量， B 卩 {v,，v 2 ，v 3 } 是一个单位正交集.由于集合线性无关，它的 
=个向量构成 R 3 的一个基，见图 6-16. 



当一个正交集中的向量被“单位化”具有单位长度后，这些新向量仍然保持正交性，因此 
新的集合成为单位正交基，见习题 3 2 . 非常容易检査图 6-16 中的向量（例 5 ) 是图 6-11 中向量 
各个方向的单位化向量（习题1 ). 

各列形成单位正交基的矩阵，在应用和矩阵算法的计算中都非常重要，它们的主要性质由 
下面定理 6 和定理 7 给出. 
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定理6 —个 wxn 矩阵 f / 具有单位正交列向量的充分必要条件是 

证为简化运算，我们假设 f / 仅有三列，每列都是 IT 中的向量，一般情形的证明本质上 
完全一致.设 !/=[«, « 2 « 3 ],并且 计算： 



V — 


ujuj uju 2 uju 3 

U T U = 

ul 

[wi u 2 a 3 ] = 

u\u x U2U2 U2U 3 


uj 


ujui u]u 2 uju 3 


右边矩阵中的元素是利用转置 r 表示的内积，{/的列向量是正交的充分必要条件是 

« 1 T «2 = « 2 T «i =0 uju } = uj «, =0 « 2 t «3 = uju 2 =0 ( 5 ) 

u 的列向量是单位长度的充分必要条 件是： 

«1 T «1=1 «2 T «2=1 «3 T «3=1 ( 6 ) 

定理可以从 （4) ~ (6) 立刻得出. ■ 

定理 7 假设 f / 是一个具有单位正交列的 mxn 矩阵，且 JC 和少是狀"的向量，那么 

a. INHWI. 

b. (Ux)-(Uy) = x y . 

c . ( t / x ).( t/jO = 0 的充分必要条件是 x . 夕 =0. 


性质 （ a ) 和 （ c ) 表明，线性映射 JCHf / r 保持长度和正交性，这个性质对很多计算机算法 
非常重要，定理7的具体证明见为题 25. 
ri / V 2 2/3" 

I 和 V 2 ，注意 f / 具有单位正交列，并且 


例6若 {/ 


1/V2 -2/3 
0 1/3 


U T U 


1 / V2 1 / V2 0 ' 

2/3 -2/3 1/3 


验证 M = W _ 


1/V2 2/3 

1/V2 -2/3 
0 1/3 


解 



' l / V 2 

2 / 3 " 

r 厂 1 

" 3 ' 

Ux =1 

1 / V2 

-2/3 

f = 

—1 

1 

0 

1/3 

L 3 J 

1 


| f / r | = >/9 + 1 + 1 = n/TT || jc | = V 2 + 9 = n/TT ■ 

当矩阵是方阵时，定理 6 和定理7非常 有用. 一个正 交矩阵 就是一个可逆的方阵 {/, 且满足 
由定理6,这样的矩阵具有单位正交列 . e 很容易验证，任何列单位正交的方阵是正交矩 
阵，恰巧，这类矩阵同样具有单位正交的行，见习题 2 7和习题 2 8.正交矩阵在第7章有广泛的应用. 


•个更好的术语应该是标准正交矩阵，这个术语可以在一些统计教材中找到.但是，正交矩阵是线性代数中的标准术语. 
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例7矩阵 

'3 /VTT -1/ V 6 -1/ V 66 
U = 1 /VlT 2/ V 6 -4/ V 66 
1/ n/TT 1/ V 6 7/ V 66 

是单位正交矩阵，因为它是方阵且它的列是单位正交的，见例5,事实上它的行也是单位正交 
的. ■ 

练习题 

1. 设, « 2 =^ 2 ^, i 兑明 {« 1) B 2 }* r 2 的单位正交基. 

2. 设是例3和图3中的记号，计算^在乙上的正交投影，用 i 


「21 

[ = 

1 


替换例3中的 i 


3. 设 f / 和; t 是例6中的记号，且少=1 _3 /^|. 验证 ： Ux Uy = x y 

习题 6.2 


在习题1~6中，判断哪一个向量的集合是正 


交的. 


1" 

-2 

1 


■ 2_ 


-5 


_-3_ 


' 5" 


-4 


0 


■ 3」 



* 3' 


■2 


T 


' 5' 

-3 

，“2 = 

2 

， u 3 = 

1 

， X — 

-3 

0 


-1 




1 


11. 计算向量 
正交投影. 


和原点的直线上的 


在习题7~10中，证明 { a p a 2 } 或者 
别是 R 2 和 R 3 的正交基，且将 x 表示为这些 W 的线 
性组合. 


-3 


* 2 


' 8 _ 

1 

， x = 

-4 

-2 


-3_ 


[;] 在 O 

12. 计算向量在通过和原点的直线上的 
正交投影. 

13. 若少=|^^|和 《 = H ，将写成两个正交向量 
之和，一个属于 Span {«}, 另一个与《正交. 

14. = ,将^写成两个正交向量 

之和，一个属于 Span {«}， 另一个与《正交. 

15. 若，=|^和《 = [^| ,计算向量^与通过《和 
原点的直线之间的距离. 

16. = • 计算向量，与通过《和 

原点的直线之间的距离. 
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在习题17~22中•确定哪一个向量集合是正交 
的，如果集合只是正交的，将向量单位化产生一个 
单位正交集. 



1/3* 


-1/2 





V 


’ 0 


17. 

1/3 


0 



18. 

1 


一 1 



1/3 


1/2 





0 


0 



*-0.6 


ro.8i 





-2/3 


■ l /3* 

19. 

_ 0.8 

， 

06 



20 


1/3 


2/3 








2/3 


0 


1/ nAo 


3 / >/io 


「 

0 

1 


21. 

3/^0 


-1/V20 


-1/W 



3/V20 


-1/V20 



1/^J 



r \/yfi&' 


'i/^l 


「-2/31 



22. 

4/M 



o 



./3 




\/M 


-1/ 万. 


-2/3. 




在习题23~24中.所有向量属于 R "， 判断下 
述论断的正误，验证每一个结论. 

23_ a . R •上的每一个线性无关集并非都是正交集. 

b _ 如果^是正交集中非零向量的线性组合，那 
么线性组合的权数可不用矩阵的行变换求得. 

c . 如果非零向量构成的正交集中的向量被单 
位化，那么，其中一些新向 M 可能不正交. 

d . —个具有单位正交列的矩阵是正交矩阵. 

e _ 如果 L 是通过原点的直线，并且 {是 少在 
i 上的正交投影，那么 |列表示 j 到 t 的 
距离. 

2 4 _ a . IT 中的每一个正交集并非都是线性无关的 

b . 如果集合 S ^ Ki ,•..,!»,} 具有性质.当 
时， u , Uj =0, 那么 S 是单位正交集 • 

c . 如果 mx ” 矩阵的列是单位正交，那么线性 
映射 JtH / U : 保持长度. 

d . 向量: y 在上的正交投影和;^在 ( c ^ 0 ) 
上的正交投影一致. 

e . —个正交矩阵是可逆的. 

25. 证明定理7 ( 提示： 对 （ a ), 计算 If / xf 或首先 

证明 （b )). 


26. 若 W 是 M" 中 n 个非零正交向量张成的子空 
间.试说明 jy = M ". 

27. 若£/是具有单位正交列的方阵，说明为什 
么可逆.（注意证明中的定理 .） 

28. 若 t/ 是 nxn 正交矩阵.证明£/的行向量构成 
K " 的单位正交基. 

29 •若"和 V 是正交矩阵，说明为什么 W 也是正交 
矩阵 （ 即说明为什么 W 可逆且它的逆为 (f/V) T ). 

30- 若是正交矩阵且矩阵 V 是交换£/中某些列 
得到的矩阵，说明为什么 V 是正交矩阵. 

31. 证明： 向量少在 K 2 中通过原点的直线 L 上的正 
交投影 f 的公式，不依赖 i 中非零向量 B 的选 
择，为验证结论，可假设:》^和《是给定的，且 f 
用公式 （ 2 > 计算，将公式中的《用代替，其 
中 c 是任意非零值，证明新公式给出同样的 f • 

32. 设 |v,, V2 } 是非零向量的正交集， Cl * C2 是任意 
非零数，证明 kMAh } 也是正交基，由于集 
合的正交性可由成对向量确定，这说明如果正 
交集中的向量被单位化，新的向量集合仍然是 
正交的. 

33. 设 1T 中 SL = Span{ii}. 证明映射 

Jf — proj t jr 是一个线性变换. 

34. 设] R ■中 II #0. t=Span{«} . 对] R" 上的 丨 

在 i 上的反射是点 refl t > ,定义为 refl L y = 
2-proj^-j- . 观察图像，其表明 refld 是 
■P = proj ti y 与夕-少的和.见图 6-17. 证明映射 

是一个线性变换. 



图 6-17 
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36. [ M ] 假若 t / 是由习题 35 中矩阵4的每一列单 
位化 得到： 

a. 计算 t / T t / 和它们的不同在哪里？ 

b . 任意产生一个 K 8 中的向量并且计算 
p = UU T y fflz = y-p . 解释为什么/>属于 
CoM ,验证 z 和 p 正交. 

c . 验证 z 与 " 中每一列正交. 

d . 注意 _v = p + z . p 属于 Col /1. 解释为什么 
z 属于 ( Col 4,（ ^的这个分解的特点将在 
下一节解释）. 

练习题答案 

1. 向量相互垂交，因为 
.它们是单位向董，因为 

||«,| 2 = (-1/V5) 2 + {2lSf = 1/5+4/5 = 1 
|« 2 | 2 = (2/V5) 2 +(1/V5) 2 = 4/5+1/5 = 1 

特别地.集合线性无关，由于集合包含两个向量，因此构成 K 2 的一个基. 

2. 心 oo 有郭 ]“[;]=[:]. 

这和例3中的 f 一致，正交投影似乎不依赖于直线上向量《的选取，见习题 31. 

'l/>/2 2/3] 

3. 砂 = -2/3 " 3>/2 

0 1/3 L 6 ■ 

同样，例6中， ^ = 和 "jr = |- l |. 因此， l / Jf -^ = 3+7 + 2 = 12 B-jr > = -6+18 = 12. 

6.3 正交投影 

R 2 中点在通过原点的直线上的正交投影和空间 R " 的情 
形非常类似，对给定 向董: y 和 R " 中子空间 W ， 存在属于 W 的 
向量 _ p 满足： （1) W 中有惟一向量 _ p , 使得与 W 正交， 

(2) _?是灰中惟一最接近 j 的向董，见图 6-18. 多的 这两个 
性质提供了本章介绍实例中提到的求线性方程组的最小二乘 
解的方法，完整的内容在 6.5 节中学习. 




35. [ M 】 证明矩阵4的列正交性可由适当的矩阵运 
算来完成，说明你的计箅过程.其中矩阵 是： 



图 6-18 
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为准备第一个定理，我们注意到，当: F 表示成 K " 空间中基线性组合时，： K 中和 
的各项可分为两部分，使得: y 写成 

_ y = z ，+ z 2 

此处， Zl 是其中一些 U , 的线性组合， z 2 是其余故的线性组合，当{的，… , u „} 是正交基时，这个 
思路特别有用.回忆在 6 . 1 节，表示所有与 W 正交的向量集合. 

例 1 假若{叫，…,!^}是 1R 5 中的正交基，且 

y = c l Ui + … + c 5 Us 

考虑子空间 IVsSpanli ^%}, 并将 少写成 W 中向量 z , 与中向量 z 2 的和 • 

解写出分解式 



其中 

Zi = c , M ,+ CjH 2 属于 Span { H ,, Hj } 
z 2 = c 3 u 3 + c 4 u 4 + c 5 b s 属于 Span { H 3 , H 4 ， H s } 

为证明 z 2 属于只需证明 22 与以为基的空间中的向量正交（见 6.1 节），利用内 
积的性质计算 

Zi-U x = (c 3 «3 +C 4 U 4 +c 5 tt 5 )«l 

= C 3 U 3 “1 +c 4 tt 4 «i +C 5 u 5 Ui 
= 0 

上式中利用了 B , 与 《 3 ，《^ B 5 的正交性.同样的计算可以证明 & tt 2 =0, 从而说明心属于 W ' ■ 
下面的定理表明，在没有 R " 中的正交基时，对例1中的分解 3>= Zl + z: , 同样可以计算只 
需 VV 中有一个正交基即可. 


定理 8 (正交分解定理） 

若 VV 是 R " 的一个子空间，那么 R " 中每一个向量少可以惟一表示 


此处属于 VV 且 Z 属于 


JLz = y - y . 


y = y+z 

实际上，如果{!!,,••.，〜} 是灰的 任意正交基，那么 

^ yjh . Ul + ... + u ^ 

«1 Hi U p -u p r 


其中 （ 1 ) 式中的称为 y 在 W 上的正交投影，常记作 pro j w _ y _ 见图 6 - 19 , 当州是 一维子 
空间时._?的公式和 6 . 2 节中的公式一致. 



图 6-19 _^在撕上的正交投影 
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证若 {“,，■"，“,} 是 W 的正交基，且 j * 用 （2) 式定义. 0 由于 j ； 是基 ，…外 的线性组合， 
所以{属于 VV . 假若 z = _ y -_ f ，由于正交于 k 2 ，…，，从 （ 2 ) 式可以得出 

z=(y-y)-u, = y u, -j ^ u, Ik, k, -0 - 0 = y u, -y u, =0 

^ Wj -a, j 

从而2与《，正 交. 类似地， Z 与空间 W 的每个基 向量心 正交，因此 Z 与 W 中任何向量正交，即 
Z 属于 

为证明分解 （1) 是惟一的，若 J 也可以写成3-：?,+ 2| ，其中免属于价且 2 ，属于 那 
么夕 + z =_ p ,+ z , (由于两边的少相同），从而得出 

y-y t =z,-z 

这个等式表明向量 V = - 免属于 w ,又属于(由于 Z , 和 J ： 属于且 VV 1 是子空间）.因此 
v v =0 ,从而说明 v =0, 即证明 j *= 免且 Z| = z . _ 


分解式 （ 1 ) 的惟一性表明’正交投影 j ) 仅依赖于 VV ，并不依赖于 （ 2 ) 中使用的特殊基. 

注意到是 M ^ SpanhA } 的正交基，将少 

_ _ J 

写成属于 W 的向量与正交于 W 的向量之和. 

解 J 在 W 上的正交投影是 


例2假设《,= 

"2~ 

5 

,«2 = 

'-2 

1 

和 *y = 

"r 

2 


L -1」 


1 


3 



2 


"-2" 


- 2" 


'-2 


-2/5' 

5 

+ 1 

1 

_ 9 

5 

+ 15 

1 

= 

2 

- 1 . 

6 


30 

- 1 . 

30 



1/5 - 


T 


~-2/5" 


'7/5' 

2 

- 

2 

= 

0 

L3j 

1 

l /5_ 


14/5_ 


定理8保证属于 W 1 ， 为检验计算，一个好的方法是验证正交于《,和《 2 ，因而 
正交于: y 的期望分解式是 


T 


'-2/5' 


'7/5" 

2 

= 

2 

+ 

0 



1/5 


14/5 - 


正交投影的几何解释 


^当州是一维子空间时，公式 （2) 的 projo 仅包含一项，这样，当 dhnW > l , ( 2 )式中的 
每一项都是自己，即向量 j 在由 W 的一个基“所生成的子空间上正交投影图 6 _ 20 表示当 w 是 


G 我们可_设狀不是零子空间. 賴 ⑴即为 pGo. 下-雜 说明 R， 顿任意非零子空间都有正 
交基. 
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R 3 中由《 ，和 《 2 所生成子空间的情形，免和爲分别表示 J 在由叫和〜所生成直线上的投影，向 
量少的 W 上正交投影 j * 是 _ y 在两个相互正交的一维子空间分别投影之和，图 6-20 中的向量 j * 对 
应 6.2 节图 6-14 中的向量: y , 其原因是现在 j * 属于 VV . 



9i + h 


图 6-20 向量 j 的正交投影等于它在相互正交的一维子空间上的投影之和 


正交投影的性质 

如果{«,，…， k p } 是 VV 的正交基，且假若正好属于 w ,那么 projo 的公式和 6.2 节中定理 5 
里: y 的表达式完全一致，这种情形下， proj w y = y . 

如果 少属于 VV = Span {«, ,那么 projo = 少 
这个结论可以从下列定理得出. 

定理9 (最佳逼近定理） 

假设 W 是 R " 空间中的一个子空间，少是》"中的任意向量，是少在价上的正交投影，那 
么_?是价中最接近> 的点，也就是指 

b-3>||<b-v|| ⑶ 

对所有属于 VV 又异于 j * 的 v 成立. 


定理9中的向量 j * 称为 W 中元 索对: y 的最佳通近，在后面章节中，我们会研究这样的问题， 
对给定的元素: y ， 可以被某个给定子空间中的元素代替或“逼近”，用 ||： y - v || 表示的从: y 到 v 的 
距离，可以认为是用 v 代替: y 的“误差”，定理9说明误差在 v = j * 处取得最小值. 

方程 （3) 同时给出一个结论，重新证明了 j * 的计算不依赖于特定正交基.如果 W 的一个不 
同的正交基被用于构造: y 的正交投影，那么这个投影就是向量: y 在 W 中的最近点，记为 j ). 

证取 VV 中的 v 且不同于_?，见图6-21，则是 VV 中的向量，由正交分解定理， 

正交于 VV ， 特别地，正交于 v - j * ，由于 

_ y_v = ( 少一夕） +(^- v ) 

由勾股定理可知 

卜 vim+|j ； -v| 2 

(见图6- 2 1中右边的直角三角形 •） 因为可知 | j )- v | 2 >0, 则不等式 （3) 立刻推出. 
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图 6-21 ，在评上的正交投影是 W 中离^最近的点 



例3如果 u , 


• i 


-2 


r 

5 

，“ 2 = 

1 

，少 = 

2 

-1 


1 


3 


和 W sSpanfu ,，!^ ,类似例2, IV 中离 _ y 最接近的点是 


y = yjfL U}+ yj^ t 

II, II, u 2 u 2 


-2/5 l 

2 

1/5 


■ 


例 4 R " 中的一个点 j 到一个子空间 W 的距离，定义为从，到空间灰中最近点的距离，求 
出到 VV = Span { u ,, u 2 } 的距离,其中 

' - 51 


解由最佳逼近定理，从少到 VV 的距离是|卜-列，且 hprojo , 由于{«,,« 2 )是 W 的正交 
基，我们 得到： 



||_ y - 列 2 =3 2 +6 2 =45 


从 j 到 W 的距离是 @ = I 

本节最后的定理说明.关于 proj *^ 的公式 （2), 当 W 的基是单位正交集时如何被简化. 


定理 10如果 { m ,， …, 《 p } 是] r 中子空间 W 的正交基，那么 

pro > y = {y u ,) u,+(y u 2 ) u 2 + - + (y u p ) u „ (4) 

如果 t / =[ M , U 2 ■■- Kp 】， 则 

pT (^ w y = UU r y , 对所有 jeK ” 成立 （ 5 ) 

证公式 （ 4 ) 可由 （ 2 ) 式立刻推出，同样， （ 4 ) 式说明 projv ^是 t / 中列的线性组合，且 
对应权值分别为 _ y . w ,，_ y .« 2 ，•••， _ y . Mp ， 同样可写成 h ；^， u Jy , ujy . 这表明它们可以记为 
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从而证明了 （5) 式. ■ 

若 {/是 nxp 列单位正交的矩阵， W 是 t / 的列空间，那么 

U T Ux = I„x = x , 所有属于 K p 的 x 成立 定理6 

UU r y = proj w y ,对所有属于 K " 的: y 成立 定理 10 

如果是” x ” 方阵，且列单位正交，那么 t ； 是正交矩阵， W 的列空间是全部■空间，且 
UU T y = Iy = y ,对■所有: yeK " 成立. 

尽管公式 （4) 在理论上十分重要，实际上，它常包含数字的平方根运算（在《<的元素中）， 
用手工运算时我们推荐公式 （ 2 ). 

练习题 



-7' 


[叫 


-9 

令《,= 

1 

4 

, u 2 = 

1 

-2_ 

， y = 

1 

6 


， 且州 =5 卩如 {« | ，《 2 } ，利用叫和〜正交计算 proj ffi y 


习题 6.3 

在习题1和习题2中，我们假设，…，《 4 }是 
R 4 中的正交基. 

51 
-3 


10 

将 x 写成两个向量之和，一个属于 

0 

Span {«,，《 2 ，《 3 } ,另一个属于 Span {« 4 }. 


3. y = 


4. y - 


5. y = 


6 . 少 : 


2. «i = 

r 

2 

1 

，«2 = 

'-2 

1 

-1 

，«3 = 

r 

1 

-2 

，«4 = 

-f 

1 

1 


1 


■ 


_1_ 


-2_ 


， u 2 = 

r 

- 1 


[-2J 


将 v 写成两个向量之和，一个属于 


在习题7~10中，若 W 是由《组成的子空间， 
将少写成 W 中的向量与正交于 W 的向量之和. 


8 .少 = 


Span {«,} ,另一个属于 Span {« 2 ，《 3 ，《 4 }. 

在习题3~6中，验证是一个正交集， 
并找出^在由正交向量《,和《 2 所生成的子空间上 
的正交 投影. 



r 


'5' 

， =j 

3 

’ «2 = 

1 


_-2_ 


4 


, Wl = 

1" 

1 

， U 2 - 

3 




1 


_-2_ 



， U \ = 

0 

,«2 = 

-1 

3 

1 

,« 3 = 

—1 

0 

1 


1 


r 2 


1 
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10 . y- 


在习题11和习题12中，在 v , 和 v 2 K 生成的 
子空间 W 中，找出距离 y 最近的点. 



'3' 


' 3" 


r 

11. y = 

5 

iiJ 

， v, = 

-!J 

， V 2 = 

-i 

i 

-i 


12. y = 

[-「 

1 


1" 

-2 

-1 

， v 2 = 

4 

1 

0 


13 


. 2 


_ 3 


在习题 13 和习题 14 中，在形如研+印，的 
向量中找出最接近 z 的向量. 


3 


" 2' 


r 

-7 

2 

， v,= 

-1 

-3 

， v 2 = 

i 

0 

3_ 


1_ 


- 

' 2' 


' 2 


.5. 

4 

0 

， v,= 

0 

-1 

， V 2 = 

-2 

4 

-1 


_-3_ 


— 2_ 


15. 假设少= 


' 5" 


-3" 


'-3 

- 9 

, «,= 

-5 

， u 2 = 

2 

hJ 


• 1」 


1 


找出向 


量少与 R 3 中《,和《 2 所生成平面的距离. 

16. 若少， v , 和 v 2 如习题12中所示，找出少到《 4 
中 *>, 和 v 2 所生成子空间的距离. 


17. 设 _y = 

"4" 

8 | 

， «.= 

~2/3* 

1/3 1 

， «2 = 

-2/3' 

2/3 



1 

2/3} 


1/3 


且 


W = Span(«,,« 2 }. 

a. 若 "=[«, « 2 ]，计算 i/ T i/ 和 

b. 计算 proj Wi y 和 (UU T )y . 

l/Viol 

a . 若 " 是 2 xl 矩阵，其列向量为《,，计算 


18. 设少=$ ,«,=| : ，；；^W=S P anl«,} 


i / T " 和 UU T . 
b . 计算 projy 和 (UU T )y . 



1" 


" 5" 


0" 


19. 假设 《,= 

1 

_-2_ 

,«2 = 

:;」 

和 《 3 = 

tj 

，注意和 


« 2 正交，但《 3 和《，或《 2 不正交，可以证明《 3 
不属于《,和《 2 所生成的子空间，利用这个事 
实，构造 R 3 的非零向量 v 与《 l 和《 2 正交. 

0' 

20. 设《,和《 2 如习题19所示，且《 4 = 1，可以 

0 

验证《 4 不属于《,和《 2 所生成的子空间 W ，利用 
这个结论构造 R 3 的非零向量 v 与《，和《 2 正交. 
在习题21~22中，所有向量和子空间均属于 
1 T ， 判断下列结论的正误，验证每个结论. 

21. a . 如果 2 与《 1 和《 2 正交，且 W sSpan ^ juuj ^} ， 

那么 z —定属于 W ' 


b . 对任一向量^和任一子空间 W ，向量 
y - proj w ^ 正交于 W . 

c . 在子空间 w 的正交投影》的计算，有时可 
能依赖于 w 正交基的选取. 

d . 如果^属于子空间 W , 那么^在撕的正交 
投影是 J 本身. 


e . 如果” xp 矩阵 i / 的列是单位正交的，那么 


UU T y 是^在 i / 的列空间上的正交投影. 

22. a . 如果 W 是 IT 的子空间，且 v 属于 W 和 VT , 
那么 v —定是零向量. 

b . 在正交分解定理中，公式 （ 2 ) 中 f 的每一 
项在子空间 W 上的正交投影是它本身. 

c . 如果 pzdz ：：， 其中 z , 属于子空间撕且 2 2 
属于子空间,那么 Zl —定是^在 W 上的 
正交投影. 


d . 子空间 W 中的元素对向量^的最佳逼近是 
向量 y-projo . 

e . 如果一个” xp 矩阵 L ? 有单位正交列，那么 
UU T x = x , 对所有 xelT 成立. 

23. 若 A 是 / nxn 矩阵，证明 IT 中任一向量 x 可以 
表不写成太= /> + «，此处， p 属于尺0评4且《 
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属于 Nul 同样可以 证明： 如果方程处=办是 
相容的，那么存在惟一向 ttp 属于 RowA， 使 
得 Ap =b. 

24. 假若 W 是 R " 的一个子空间且是 VV 
的-个正交基.是#的正交基. 

a . 说明为什么…, 1»> ;( ，1>,,...，|^}是正交集. 

b. 说明为什么 （a ) 中的集合可以生成 R”. 

练习题答案 

计算 

yu, y-u 2 88 -2 

proj w ,y = - u, +— - “ 2 =一 «i + —— U 2 

lit -Ui u 2 u 2 66 6 


-1 

1 

」 

~3 

- 1 " 

1 


1 

4 

- 2 _ 


6 


在这种情形下，恰好是《,和《 2 的线性组合，从而 > 属于 VV, 即 W 中最接近^的点是本身. 

6.4 格拉姆-施密特方法 


c. 证明 dim W + dim 

25. [M] 若 U 是 6.2 节中习题 36 题的 8x4 矩阵， 
在 Col 1/ 中找出最接近> = (U.1,1.1.1,1.1) 的点， 
写出你解决该问题所使用的键击内容或命令. 

26. 【M] 假设 U 是习题 25 中的矩阵.求出从 

A = 到 Col 的距离 • 


格拉姆-施密特方法是对 R ” 中任何非零子空间，构造正交基或标准正交基的简单算法，本 


节前面两个例题顺便给出计算步骤. 


例1 


假设 W = Span { X |， jc 2 } ，其中 x , .构 


Oj L 2. 


造 VV = Span { jC |， x 2 } 的一个正交基. 

解子空间 VV 如图 6-22 所示.沿着 jc ,, 和太 2 在々上的 
投影 P , 与 x , 正交的 jr 2 的分量是 jr 2 -p ,它属于 VV . 其原因是 
它由4和文,的倍数相加得到，取可得 


v 2 = x 2 -p = x 2 - X, . Xl = 

X , X , 


「r 


「3- 


roi 

2 

_15 

6 


0 


45 




[ 2 J 


W 





图 6-22 正交基 { W 2 } 的构造 


那么 { v ,, v 2 } 是空间 W 的非零向量构成的正交集，由于 dimW = 2 . 可知 { v ,， M 构成 W 的一个基._ 
下面的例子详细说明格拉姆-施密特方法，请仔细学习. 



\ 


0' 


0 

例2设 x ,= 

1 

1 

1 

y ^2 — 

1 

1 

1 

» ^3 = 

0 

1 

1 


. 那么 { x ,, x 2 , x 3 } 显然线性无关，且构成 R 4 中子空间 
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VV 的一个基，试构造 VV 的一个正交基 • 

解步嫌 1.取 V, =*, 和 Wi sSpanlxihSpanlv,}. 

步驟 2. 取^是^减去它在子空间啉上的投影所得到的向量，即 
v 2 = jC2 - projwiJc 2 


"O' 


r 


-3/4 

1 

_1 

1 


1/4 

1 

4 

1 


1/4 

1 


1 


1/4 


像例 1— 样，6是々正交于X,的分量，且是由 * ，和心所生成空间的的一个正交基. 

步驟 2' (可选的）.如果合适，度量 v 2 可简化后面的计算.由于 h 具有分数分量，很方便 
用因子4重新度量向量 v 2 , 用下面两个正交基代替 { V| ， Vj }. 



■1. 


-3' 

Vi = 

1 

1 

1 

,V2 = 

1 

1 

1 


步骤 3. 取。是心减去它在子空间 叭上的 投影所产生的向董，先利用正交基 { v ,， v 〖} 计算 jc , 在 
VV 2 上的投影. 

在上 Jti 在 < 上 

的投影 的投影 

proj 灼 or, = 么 ％, + V2 

V|V, Vj-Vj 


r 

i 

丄 

-3' 

1 


* 0 ' 

2/3 

i 

+ 12 

1 


2/3 

i 


1_ 


2/3 


那么〜是4在呎上正交分量，具 体为: 


=^3 -proj^ 2 JC 3 = 

V 

0 

l 

- 

_ 0 • 

2/3 

2/3 

= 

0 

一 2/3 

1/3 


l 


2/3 


1/3 


从图 6-23 可以看到构造的图解，观察可得V,属于州，原 
因是 x 3 和 proj^xj 都属于 W . 从而 {v,,v;,v 3 } 是IV中非零向量 
构成的正交集（因而是线性无关集），由于 W 是三维空间，它 
的基又包含三个向量，所以由 4.5 节的基定理可知， {v„v^v,} 
是 W 的正交基. _ 



图 6-23 从 jc 3 和 M4 构造出 v 3 
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下面定理的证明表示这种方法确实有效，重新度量的步骤没有涉及，原因是度量只对手工 
计算作简化. 


定理11 (格拉姆-施密特方法） 

对 R " 中子空间的一个基{^，…，心}，定义 

Vi =X } 









那么{ V ,，…， v p } 是 W 的一个正交基，此外 

Span { v 1; ---, v *} = Span { x ,,---,^*} - 其中 P 


证对 1 彡 p ，取 M = Span { x ,,---,^*} .it v , = x , ,则有 Span { v ,} = Span { x ,}. 假若 对众 < p ， 
我们已经构造 v ,，...，、， 使得 是叭的 一个正交基，定义 

v* + . =x* +1 -proj„, t x t+ , ( 2 ) 

注意向量 projm ；^ 属于，因而属于 W t +1 , 又由于 x * +1 属于 M 4 +1 ,从而推出 Vw 也属于 Wt + ，(因 
为 M 4 +1 是子空间，且减法封闭）.更进一步，由于 心 +1 不属于 W ^ SpanU ,， …， x t } 可得〜 ）0. 
因而 v t +1 } 是 (fc + 1) 维空间叭+,中非零向量形成的正交集，由 4.5 节的基定理可知，这个集 
合是队 + ,的正交基，从而 W t+ , = Span { v , ，•••,&},当/1 + 1=0时成立，归纳证明过程 结束. ■ 

定理11说明任何 IT 中的非零子空间 W 有一个正交集，因为普通的基总是存在 
的（由 4.5 节中定理11 )，而格拉姆-施密特方法仅依赖于在有正交基的子空间 W 上的正交投影 
的存在性. 


标准正交基 

一个标准正交基很容易从一个正交基{^…，^} 得到： 只需单位化（度量）所有当问题 
用手计算时，它比一开始找到^就将其单位化更容易（因为可避免不必要的平方根运算）. 

例3在例1，我们构造正交集 

"3] ("0" 

Vi = 6 ， v 2 = 0 

_0J \ 2 _ 

一个正交基是 

_3 

u ,= H v, = vfe ^ 


= 

1 /V 5 ' 

2 /V 5 


0 
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「01 


m 2 = 


R V2= ? 


矩阵的0/?分解 

如果矩阵 A 的列线性无关，那么应用格拉姆-施密特方法（包含单位化）于 
等同于按下面定理描述的方法分解 A ，这种分解方法广泛应用在各种计算机算法中， 
如解方程 （ 6.5 节讨论）和求特征值 （ 5.2 节的习题提到）. 


定理12 (讲分解） 

如果 mxn 矩阵 A 的列线性无关， 那么 A 可以分解为 A = <2 尺， 其中 <2是一个 mxn 矩阵，其 
列形成 ColA 的一个标准正交基，尺是一个上三角可逆矩阵且在对角线上的元素为正数. 
证 A 的列向量形成 ColA 的一个基，构造 W = ColA 的一个标准正交基 
且具有定理11中的性质 （ 1 )，这个基的构造可由格拉姆-施密特方法或其他方法完 

成，取 

0 = [«, « 2 • - «„] 

对 /t = ，心属于 Span { xi ,...， x t } sSpanfK ,，...，*^} •所 以存在常数 r ' k ， …，， 使得 

x k = ruM ! + ..，+ 〜《* + 0 . M* + 1 +_.. + 0. M „ 

我们可以假设〜 >0 (如果〜 <0,对〜和都乘-1)，这表明 A 是<2中列的线性组合，且系 
数是下面向量的 分量： 

K 1 


Loj 

即 x t =(2 r t ， 其中 /t = l ，...， n ， 取尺 = [ r r .. rj . 那么 

A = [X, • -. X „] = [<2r, … 0rj = <2 尺 

可逆的结论，可从下面 ColA 线性无关的事实立刻得到（习题 19), 显然尺是上三角形矩 
阵，它的非负对角元素必为 正值. ■ 


例4求 A : 


0 0 
1 0 


的一个 <2尺分解. 


解 A 的列向量为例2中的 文 1 ，文 2 ,文 3 ， Col A — Sp ^ n { X ] x 3 } 的一个正交基在例2中得 


到： 
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T 


"-3" 


0 

Vl = 

1 

1 

， V2 = 

1 

1 

， v 3 = 

-2/3 

1/3 


l_ 


1 


1/3 


重新度量 v, ,取 v ;=3 v 3 , 那么将三个向量单位化得到 K| ，《 2 ， K3 ，且用这些向量组成2的 
列. 


1/2 -3/ V 12 0 . 

1/2 1/ Vl 2 -2/76 
1/2 1/ Vl 2 1/ V 6 


Ll /2 1/ Vl 2 1/ W 」 

由 <2的构造可知，<2的前 t 列是 Spanfx, ，…, x t } 的一个标准正交基.从定理12的证明可知， 


某些/?有 A = <2/?. 为找到/?， 
且 


注意到 <2 t (2 = / 以及 (2 的列是单位正交向量，所以 
Q T A = Q t ( QR ) = IR = R . 


对 


1/2 1/2 1/2 1/2 ] 100 

R= -3/Vl2 I/V 12 I/V 12 I/V 12 1 1 ° 

. 0 -2 / V6 1/V6 1/ V6 1 1 1 

'2 3/2 1 

= 0 3/Vl2 2/x/l2 
- 0 0 2/V6 

数值计算的注解 

1. 当格拉姆-施密特方法用计算机实现时，在〜的计算中，每个向量由四舍五入 
引起的误差逐渐增大’对较大但不相等的 ； 和1 标量乘法4吣也许不充分接近零， 
通过重新安排计算的阶，这类正交性的损失可以大量 减少严 然而，2尺分解常指这类标 
准化的格拉姆-施密特方法，因为它会产生更精确的标准正交基，即使分解需要双倍 
的算术计算. 

2 -为了得到一个矩阵 A 的 <2尺分解，计算机程序常常对4左乘一系列正交矩阵使 
结果变成一个上三角形矩阵，这个构造过程类似于 A 左乘一系列初等矩阵，最后得到 
A 的 Lt / 分解. 

练习题 


设 tV=Span{n} ，此处 a :, =| 11 和; r 2 


1/3' 

1/3，构造 W 的一个标准正交基. 
-2/3 


参见 咖此 of Matrix Computations, David S. Watkins (New York: John Wiley & Sons, 1991), pp. 167-180. 
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习题 6.4 


在习 

题 1~6 中 

给出的集合是子空间 W 的- 

个基，利用格拉姆-施密特方法构造 W 的正交基. 

■ 3] ' 

8" 

"oi r 5 " 

1. 0 , 

5 

2. 4 , 6 

,1」 

-6 

_2」|_-7_ 

" 2] ■ 

' 4" 

" 3] [-3* 

3. -5, 

— 1 

4. -4 , 14 

1」 

1]' 

2 

' 1 

_ 5 J [_-7_ 

_ 3… -5■ 

-4 

5. , 

-1 

6. 一 1 ， 9 

0 

—4 

2 -9 

1 

1 

-1 3 


7. 求习题 3 中向量所生成子空间的一个标准正交 
基. 

8. 求习题 4 中向量所生成子空间的一个标准正交 

基. 


在习题 9~12 中，求每个矩阵列空间的正交基. 



在习题 13~14 中，矩阵 (2 的列是格拉姆-施密 
特方法应用于矩阵 A 的列而得到的，求上三角形矩 
阵尺，使得 A = 尺，并检査你的结果. 

" 5 9] [" 5/6 -1/6' 

, 1 7 ^ 1/6 5/6 

13. A = , Q = 

-3-5 -3/6 1/6 

1 5 J 1_ 1/6 3/6 




-2/7 

5/7 

2/7 

4/7 


5/7" 

2/7 

-4/7 

2/7_ 


J57 


15. 求习题11中矩阵的 QR 分解. 

16. 求习题12中矩阵的！2尺分解. 

习题 17-18 中的所有向量和子空间都属于 
R \ 判断每一个结论是正确还是错误，验证你的 
结论. 

17. a . 如果 { v ,， v 2 , v 3 } 是 W 的正交基，那么用因子 c 

去乘 v 3 可得一个新的正交基 { v ,, v 2 , cv 3 } • 
b . 格拉姆-施密特方法将一个线性无关的集合 
11,...，；^}转化为一个正交集 { v ,,...、} ，且 
具有对每一个 fc ， 向量 V ,，…，生成的子空间 
与向量生成的子空间一致. 

C. 如果 A = (2 K ， 这里 (2 具有单位正交列，那 
么尺= . 

18. a . 如果 W ，且 { at ,,; c 2 , a : 3 } 线性 

无关，如果 { vuv ^ v 」 是 IV 的一■个正交集，那 
么 { VbVjd 是 W 的一个基. 

b . 如果 A ： 不属于子空间 W ，那么 AT - proj w A ： 不 
是零向量. 

c . 在一个2尺分解中，例如 A = !^， 2的列构 
成 A 的列子空间的标准正交基. 

19. WiiS.A = QR ,此处！2是 mxn 矩阵， R^nxn 
矩阵. 证明： 如果 A 的列线性无关，那么尺 一 
定可逆（提 示： 研究方程/?* = 0且利用4 = (2尺 
的事实）. 

20. 假设 A = 2尺，此处尺是一个可逆矩阵，证明 A 
和 (2 具有相同的列空间 .（ 提示： 对给定属于 
列4的>，存在: r 使得 > = 此外，对给定 
少属于 Col 2，存在; c 使得 > = At .) 

21. 如定理12中 A = 2 尺，说明如何找到一个正交 
mxm (方 ） 矩阵！ 2 i 和一个可逆 nx n 上三角形 
矩阵尺，使得 



当 rankA = nBf ， MATLAB 中的 qr 命令给出一 
个完全 QR 分解. 
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6.5 最小二乘问题 

〜=章^中關子，描述—个解不存_回方麵实_用中常出现这 类不; 
fit 尽管不会出難何巨大縣数矩阵.当方麵_ 不存在 但又需要_时，最好的 - 
法是寻找 X ,使得 Ac 尽可能接近 ' 

. 考 f 如 作加的 一个近似， 从 ㈣ 鈕 的距离越小，卜叫 I 近似程度越好.—般的 最小: 
乘问 题就是 找出轉 - Ar || 尽量補 x ，术语 “ 最小 二 乘”細于这样的事实 卜如 II 是平― 
和的平方根. r 11 


22. 设《,，...，《,是 IT 上子空间 W 的一个正交基， 
r:ir 4 R " 定义为 rorhproj # ，证明 r 是一 
个线性变换. 

23. 设 A = 2 尺是 mxn 矩阵 A (含有线性无关列） 
的一个 (2 尺分解.把 A 化分成 U , 决]，这里冼 
有 P 列.说明如何获得 A , 的一个 g 尺分解，并 
解释为什么这样的分解具有如此性质. 

24. [ M ] 像例2那样利用格拉姆-施密特方法，构造 
下面矩阵 A 的列空间的正交基. 

—-10 13 7 -11' 

2 1-53 

-6 3 13 -3 

16-16 -2 5 
2 1-5-7 

25. [ M ] 利用本节中方法给出习题 24 中矩阵义的 

练习题答案 


一个 Q 尺 分解. 

26. [ M ] 对矩阵算法，格拉姆-施密特方法比单位正 
交向量更有效，从定理11中的; a 开始， 
取4 =[々… a ：,], 若 nx * 矩阵 Q 的列，构成 
矩阵 A 前列所生成的子空间蝌的一个标准正 
交基，那么对于 IT 中的向量; r ，是: c 在 
恥上的正交投影 （ 6.3 节定理10 ) .如果 \ +1 是 
A 的下一列，定理11中方程 （ 2 ) 的证明变成 
v i+1 = A： t+ i - < 2 « 2 t x m ) 

( 上面的括号可以减少算术运算 .） 取„ 4+ ,= 
v * +1 / II 〜 H ，下一个步骤中的新^是 [2 « t+1 ] ， 
利用这个步骤，计算习题24中矩阵的0?分 
解，写出你所用的键盘输人或命令. 


设 V|=J：I= 1 * v 2 = A _ f ^ v 1= _ r 2 -0. v 1= _ r 2 , 这样{^ 2 }是正交向量，接下来需要向量的单位 
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定义如果 wxn 矩阵 A 和向量 ft 属于 K "， 的最小二乘解是 K " 中的 i ， 使得 
||A-Ar||<|*->bc| 

对所有 xe IR " 成立. 

最小二乘问题最重要的特征是无论怎么选 取*， 向量 Ac 必然属于列空间 Col A . 就是我们 
寻求 X ，使得 Ajc 是 Col A 中最接近 ft 的向量，见图 6-24( 当然，如果 ft 恰好在 Col >4中，那么 
就等于 Ac 且这样的 X 也是一个“最小二乘解”）. 



图6^24对 x , »与 沿的距 离小于与其他 Ar 的距离 


一般最小二乘问题的解 

对上面给定的 A 和应用 6.3 节的最佳逼近定理于 ColA 空间，取 
b = projcoi^ b 

由于6属于 A 的列空间，方程 /U =6是相容的且存在一个属于 K ” 的 i 使得 

Ax=b ( 1 ) 

由于 S 是 Col A 中最接近6的点，一个向量 i 是6的一个最小二乘解的充分必要条件是 
i 满足 ( 1 ). 这个属于 R " 的 i 是一系列由列 A 构造的系的权值，见图 6-25 ( 如果方程 （1) 有 
自由变量，则方程 （ 1 ) 会有多个解）. 



R " 


图 6-25 R " 中的最小二乘解 i 


若 i 满足沿=6,由 6.3 节的正交分解定理，投影6具有性质沙 - 右)与 Col A 正交，即 ( ft - AE ) 
正交于 A 的每一列，如 果〜是 A 的任意列，那么 a 厂沙-沿 )=0 且<|/沐 -沿 )=0, 由于每一个 
<是 A T 的行， 

A T (*-^ i ) = 0 (2) 

(方程 （2) 也可由 6.1 节中的定理3推出 .） 故有 

A t *-A t v«=0 
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A r Ax = A J b 

此计算表明 Ax = b 的每个最小二乘解满足方程 

A T Ax = A T b (3) 

矩阵方程 （3) 表示的线性方程组常称为 A 的 法方程 ， （3) 的解通常用 i 表示. 

定理13 方程 处=6 的最小二乘解集和法方程 "处= 的非空解集一致. 

证 我们已经说明最小二乘解集合是非空的，且这个 i 满足法 方程. 相反地，假若 i 满足 
A J Ax = A T b ,那么 i 满足上面方程 （ 2)，从而说明 必 与，的行正交，即与4的列向量正交. 
因为4的列生成 Col A ,向量 ft -必 与所有 Col / l 的向量正交，因此方程 = 沾- 处） 是将办 

分解成 Col / I 中的一个向量与正交于 Col / I 的一个向量 之和. 根据正交分解的惟一性，沿必须 
是将6投影到 Col A 的正交投影.所以， 必 =6成立，且 i 是一个最小二乘解. ■ 

例1求不相容方程的最小二乘解，其中 



'4 O ' 


" 2 

A = 

0 2 

， b = 

0 

i 

Lid 


11 


解 利用 （ 3 ) 计算 


那么方程 = 变成 




行变换可用于解此方程组，但由于是 2 x 2 可逆矩阵，很快计算得到 



那么可解= 如下： 


x = ( A T Ay ' A T b 

、、 = ^[-1 二 ] ■ 

在许多计算中，是可逆的，但并不总是这样，下面例子中的矩阵出现于统计学中的方 
差分析问题. 

例2求 Ar =6的最小二乘解，其中 



正交性和最小二乘法 


361 


"110 0' 


-3" 

110 0 


—1 

10 10 

, b = 

0 

10 10 


2 

10 0 1 


5 

10 0 1 


1 



矩阵方程 A 1 Ax = A'b 的增广矩阵是 

"6 2 2 2 4] [1 00 1 3" 

2 2 0 0 -4 010 —1 -5 

2 0 2 0 2 ~ 0 0 1 -1 -2 

2 0 0 2 6 _| |_0 0 0 0 0 

通解是： X, = 3- x 4 , jc 2 = -5 + jc 4 , x 3 = -2 + x 4 , 文 4 是自由变量 • 
所以， /4 jc =6 的最小二乘通解具有下面形式 



' 3' 


-f 


-5 

-2 

+ J ： 4 

1 

1 


0 


1 


下面的定理给出判断准则，在什么条件下，方程 Ax =6的最小二乘解是惟一的 .（ 当然，正 
交投影6总是惟一的 .） 


定理14矩阵是可逆的充分必要条 件是： / I 的列是线性无关的，在这种情形下，方 
程处=6有惟一最小二乘解 i 且它有下面的表示 

x = ( A T Ay ' A T b (4) 

定理14证明的主要部分在习题19~21中给出，证明的同时也复习了第4章的概念.用公式 
(4) 计算 i 的方法主要具有理论意义，当 / T /1 是 2 x 2 可逆矩阵时也可用手工计算. 
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当最小二乘解 i 用于产生6的近似逼近时，从6到 AE 的距离称为这个近似的最小二乘 


误差. 

例3如例1给出 A 和6 ,确定如=办最小二乘解的最小二乘误差. 
解从例1可知 


■2 


"4 0 

ni 

4" 

0 

和沿= 

0 2 

I 1 = 

4 



L 2 J 


11 


1 1 


3 


因此 



'2' 


"4' 


'-2 

b — Ax = 

0 

一 

4 

= 

-4 


11 


3 


8 


II* - Ac I = yji-2) 1 + (-4) 2 +8 2 = >/84 

最小二乘误差是对任意属于 K 2 的 jc ， 从6到向量 Ac 的最小距离是>/巧，见图 6-26, 
注意最小二乘解 JE 自己并没有在图中出现. 



最小二乘解的另一个计算 

下面的例子表明，当 A 的列向量不正交时，如何找到 Ac =6的最小二乘解，这类矩阵常出 
现在下节要讨论的线性回归问题中. 

例4找出 Ac = A 的最小二乘解，其中 



1 -6 


-r 

A = 

1 -2 

1 1 

， b = 

2 

1 


1 7 


6 


解由于 A 的列 fl | 和列 < i 2 相互正交， h 在 ColA 的正交投影 如下： 
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a { Ui a 2 o,2 




~2 


"-3" 


"-1 " 

2 

+ 

-1 


1 

2 


1/2 


5/2 

_2 


7/2 


11/2 


既然 a 已知，我们可以解必=6.这个很容易，因为我们已经知道6用 a 的列线性表示时 
的权值.从 （ 5 ) 立刻 得到： 

,=[ 8/4 ] = [ 2 1 - 
[ 45/90 J [ l /2 j 

某些时候，最小二乘解问题的法方程可能是病态的，也就是中元素在计算中出现较小 
的误差，可导致解 i 岀现较大的 误差. 如果4的列线性无关，最小二乘解常常可通过4的2尺 
分解更可靠地求出（见 6.4 节的描述 ）. e 

定理15给定一个 mx ” 矩阵 A ， 且具有线性无关的列，取 A = 0? 是 A 类似定理12的2尺 
分解，那么对每一个属于 R m 的6，矩阵有惟一的最小二乘解，其解为 

x = R'Q r b ( 6 ) 

证 ^Lx = R 'Q J b , Ax = QRx = QRR 'Q^b = QQ T b . 

由定理12， 2 的列形成 CoM 的正交基，因此，由定理10，224是 * 在 CoM 上的正交投 
影 K 那么必= 6说明无是鈕=办的最小二 乘解. 无的惟一性可从定理14得出. ■ 

数值计算的注解由于定理15中的/?是上三角形矩阵， i 可从方程 

Rx = Q ! b (3) 

计算 得到. 求解方程 （7) 时，通过回代过程或行变换比利用 （6) 计算 / T 1 更快. 

例5求出 Ac = A 的最小二乘解，其中 


解利用 6.4 节可得4的0/?分解. 



"1 3 5" 


" 3' 


1 1 0 


5 

A = 

1 1 2 

， b = 

7 


1 3 3 


-3_ 


A = QR = 


1/2 1/2 


1/2 - 1/2 1/2 
1/2 1/2 - 1/2 



"2 

4 

5' 

I 

0 

2 

3 

| 

0 

0 

2 - 






W 在 G. Golub and C. Van Loan, Matrix Computations,3rd ed.(Baltimore: Johns Hopkins Press, 1996 ), pp. 230-231 中给出 
QR 分解方法和标准法方程方法的比较. 
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那么 


Q T b = 






" 3 " 



" 1/2 

1/2 

1/2 

1/2 

C 


' 6 " 

1/2 

- 1/2 

- 1/2 

1/2 

J 

= 

-6 





7 



1/2 

- 1/2 

1/2 

- 1/2 

- 3 _ 


4 


满足 /?x = G T 办的最小二乘解是 i， 也就是 


"2 4 5 " 

4 


' 6 ' 

0 2 3 

文 2 

= 

-6 

0 0 2 

_^ 3 _ 


4 


" 10 ' 

这个方程很容易解出，且1= -6 

2 


练习题 


—1-3 

-3" 


' 5" 

1 5 

1 

和* = 

-3 

_1 7 

2」 


_-5_ 


，求 Ac =6的一个最小二乘解，并且计算最小二乘解的误差. 


2 ,当6与4的列正交时，对最小二乘问题的解，你可得出什么结论？ 


习题 6.5 


在习题1~4中，求的最小二乘问题的 
解. （ a ) 通过构造法方程求 f . ( b ) 直接解 f . 

• f -1 2] 「4 _ 

1. 2 -3 ，办=1 

-1 3」 [2 

~ 2 ll 「-5 _ 

2. A 二 — 2 0，办= 8 

2 3 [ 1_ 

" 3' 

， b= 1 
-4 

2 

'5' 

， b = I 
0 



在习题5~6中，求方程 Ac =6的所有最小二 
乘解. 


\ 0 " 


Y 

1 0 

, b = 

3 

1 0 1 


8 

1 0 1 


2 

"1 1 0' 


7" 

1 1 0 


2 

1 1 0 

, b = 

3 

1 0 1 


6 

1 0 1 


5 

1 0 1 


4 


7. 计算习题3中最小二乘问题相关的最小二乘误 

差. 

8. 计算习题4中最小二乘问题相关的最小二乘误 

差. 

在习题 9-12 中，求 （ a ) <>在(：014的正交投 
影， （ b ) 最小二乘问题=6的解. 
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" 3 4' 
13. 令 _4= -2 1 


3 4 




计算如和如，并与 相比较 ，II 


是否为 Ac =6的最小二乘解？（不用计算最 
小二乘问题的解，回答这个问题 .） 



v =\_ l \ • 计算如和如，并与办相比较，是 


否有可能至少有一个 U 或 v 是 Ac =6的最小 
二乘解？（不用计算最小二乘问题的解，回 
答这个问题 .） 


在习题 15~16 中，利用分解 _4 = 2/? 求 
的最小二乘问题的解. 



"2 

3' 


2/3 

-1/3" 

[o 

；1 


~1 


15. 4 = 

2 

4 

= 

2/3 

2/3 

b = 

3 



1 

1 


1/3 

-2/3_ 

】」 





"1 

-1 


"1/2 

-1/2' 




■- 

r 

16. A = 

1 

4 


1/2 

1/2 

[ 2 

3 ] 

b — 


6 


1 

-1 


1/2 

-1/2 

Lo 

5 」 



5 


_1 

4 


1/2 

1/2 - 





7_ 


在习题17~18中，4是 mxn 矩阵且6属于 
K m , 判断下列命题正确或错误，验证每一个答案. 

17. a . 一般最小二乘问题是求出 X 使得 Ac 尽可能 

接近 A . 

b . 方程 = 6 的最小二乘解是适合方程 
Ax = b 的向量 i ，此处6是办在 Col A 上的 
正交投影. 

c . 方程的最小二乘解是向量 i ，对所 
有属于 IT 的 X 满足 

| 卜碌 |&- Ae | 

d . 方程 ， Ac =/<>的任意解是方程 Ac =<>的 
最小二乘解. 

e . 如果的列线性无关，那么方程 A « r =<> 只 
有一个最小二乘解. 

18. a . 如果 属于的列空间，那么方程的 

每个解都是最小二乘解. 

b . 方程 Ac =<> 的最小二乘解，是属于_4的列空 
间中最接近6的点. 

c . 方程=6的最小二乘解是一系列的分量， 
当它们作用在 A 的列，产生 <>在(：01/1上的 
正交投影. 

d . 如果 i 是 Ac =<>的一个最小二乘解，那么 
x = { A ^ Ay ' A T b . 

e . 法方程计算最小二乘解的方法总是可靠的. 

f . 如果 A 有一个讲分解，如 A = 2/?，那么求 

最小二乘解的最好方法是计算 
x = R ' Q r b . 

19. 设4是一个 mxn 矩阵，利用下面的步骤说明， 
x 属于 K " 且满足 Ac = 0 的充分必要条件是 
A t Ax = 0 . 这将证明 Nul /^ NulAM . 

a . 证明：如果 Ac = 0， 那么 

b . 假若，处= 0,解释为什么 xM T A«r = 0 且 
利用此式说明 Ac = 0. 

20. 设4是一个 mxn 矩阵且，4是可逆的，证明 
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4的列向量线性无关 .（ 注意： 不能假设4可 
逆，且更不一定是方阵 .） 

21. 设4是 mxn 矩阵且列向量线性无关（注意： 4 
不一定是方阵）. 

a . 利用习题19证明是可逆矩阵. 

b . 解释为什么4具有至少与行一样多的列. 

c . 确定4的秩. 

22. 利用习题19证明 ranki 4 M = ranki 4. (提 示： 
■4 M 有多少列？如何与， A 的秩联系起来？） 

23. 假设4是矩阵且有线性无关的列， ft 属 
于 IT ,利用法方程给一个计算6的公式，6是 

在 Col 上的投影 .（ 提示： 首先找到 i ,这 
个公式不需要 Col 4的正交基 .） 

24. 当4的列是单位正交时，找出方程 Ac =6最小 
二乘解的一个公式. 

25. 列出下列方程组的所有最小二乘解. 

x+y = 2 
x+y = 4 

26. [ M ] 4.8 节的例3显示一个低通线性滤波器，将信 
号以*}过滤为 0> t +1 }. 并将高频信号 { w t } 过滤为 
零信号，其中; y ! = cos ⑽: M ) 和 w * = cos (3 rot /4) , 
下面计箅将设计一个滤波器近似满足此特性. 
滤波器方程为 

aoy ^ i + a ^^+^ y^Zk ,对所有灸成立 （8) 
因为信号是周期的，且周期为8,对方程 （8) 
只需研究 A = 0, …，7即可.滤波器的作用是 
将上面描述的两个信号转化为两组8个方 

练习 题答案 
1. 首先计算 


程组. 

yk + 2 yk+i yk yk+i 


= 0 

c = 1 

~ 0 

-0.7 

0.7 

0 

1 

0.7 


[r 


—1 

-0.7 

0 

~ a 0 ' 


-0.7 


-0.7 

— 1 

-0.7 


一 1 


a , 


0 

-0.7 

-1 


-0.7 


0.7 

0 

-0.7 

Ch 


0 



1 

0.7 

0 


0.7 

= 7 

0.7 

1 

0.7 _ 


1 

J 


咐 +2 


w k 




灸= 0 

" 0 

-0.7 

1 ' 


*0 


k = \ 

0.7 

0 

-0.7 


0 



-1 

0.7 

0 

' a o 


0 



0.7 

-1 

0.7 


0 



0 

0.7 

-1 

a x 

= 

0 



-0.7 

0 

0.7 

. a 2 


0 



1 

-0.7 

0 


0 


k = l 

-0.7 

1 

- 0.7 


0 



写出一个方程 Ac =<»， 其中4是一个 16 x 3 矩 
阵，由上面两个系数矩阵组成，属于 nr , 由 
上面两个方程右边的向量组成. 

最小二乘解确定的心叫為（上面数据中的 0.7 
是力/2的一个近似值，用以说明典型的实际 
问题中如何进行计算.如果用 0.707 代替，所得 
过滤系数与精确的算术计算结果力/4, 1/2, 
力 M 相比至少有7位相同的十进制位数）. 



.11 

1]「1 -3 

-3 


"3 

9 O ' 


-3 5 

715 

1 

= 

9 

83 28 


-3 1 

2 _|l 7 

2 


[0 28 14 


' ill ' 

' 5' 


'-3' 


A r b = 

-3 5 7 

-3 

= 

45 



-3 1 2 

-5 


-28 
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下一步，行化简标准 方程， = 对应的增广 矩阵： 


^3 9 0 -3 " 


"1 3 0 -1 " 


"1 0 -3/2 2 

9 83 28 -^5 


0 56 28 -56 


01 1/2 -1 

0 28 14 —28」 

1 

0 28 14 -28」 


0 0 0 0 


一般最小二乘 解是々 =2 + -~j: 3 , x 2 =- 1 -~ Xj , ;c 3 是自由变量. 
取4=0,可得一个特 殊解： 

' 2 
x = -1 
0 

为得到最小二乘误差，计算 



'1 -3 -3' 

' 2 _ 


■ 5 ' 

= Ax = 

1 5 1 

― 1 

= 

-3 


1 7 2 

0」 


- 5 _ 


结果出现“<>，所以 ||*-q| = 0， 由于<>恰好属于 ColA ,最小二乘误差为零. 

2. 如果 与4的列正交，那么 在4的列空间4的投影是0,在这种情形下， Ac = ft 的最小二乘解 x 满 
足 4i = 0. 

6.6 线性模型中的应用 

科学和工程中的一项任务就是分析或理解一些数量变化之间的 联系本 节描述各种情形下， 
数据被用作构造或验证一个公式，该公式可预测一个变量作为其他变量值的 函数. 在每种情形 
下，问题会等同于求解一个最小二乘问题. 

为了更容易应用所讨论的实际问题，如读者以后学习遇到的专业知识，我们选取科学和工 
程数据最常见的统计分析记号•将 Ar = A 写成 = ,且称 x 为设计矩阵， ）8 为参数向置 y 
为观测向置. 

最小二乘直线 

变量 AT 和3> 之间最简单的关系是线性方程： 3> =凡+戽 x . s 实验中数据常常给出点列、 
(々，乃)，…^，^)，而它们的图形近似接近于直线，我们希望确定参数汍和戽，使得直线尽可 
能“接近”这 些点. ^ 

假右月。和饵固定，考虑图 6 — 27 的直线3> =月。+戊 X . 对应每一个数据点(七，力），有一个在 
直线上点列 ( Xj , P 0 + P lXj ) 具有同样的 坐标. 我们称 A 为的观测值 ，而 P Q + 为 y 的预测 
值 （ 由直线确定），观测 _V 值和预测: V 值的差称为余差. 


㊀ 这个记号在最小二乘直线中代替 + 
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V 

点 

( x j, yj) 



■^(^j,Po+PlXj) 


直线上的点/ 




y=Po+P\x 


Xi 

Xj X n 


图 6-27 实验数据的直线拟合 


有几种方法来度量直线如何“接近”数据，最常见的选择是余差平方之和（主要原因是数 
学计算简单）， 最小二 乘直线 >> =汍+戽文是余差平方之和最小，这条直线也称为: V 对^的回归直 
线，因为假设数据中的任何误差只出现在 y 坐标，直线的系数 ft , 负被称为（线性）回归 系数. 6 
如果数据点在直线上，参数汍和 A 满足方程 

预测的 观测的 
少值 少值 

Po + PiXi = y, 

Po + Pix 2 = y 2 


Po + )3ix„ = y„ 


我们可将这个方程写成 


xp = y , 其中 A ：= 

■1 ' _ 
1 心 

’肸 u 


V 

y 2 


1 



yn _ 


当然，如果数据点不在直线上，就没有参数々。，戽使得义)8中的预测: V 值与: V 中的观测: V 值相 
等，而 = 没有解.这就是 Ac = A 的最小二乘解问题，只是记法不同！ 

向量 XjS 与: v 距离的平方精确表达为余差的平方之和，于是，使平方和最小的 )8 同样使得 
XjS 与: v 之间的距离最小，计算 = 的最小二乘问题等价于找出 J 8, 它确定图 6-27 中的最 
小二乘直线. 


例1 求 方程; >> =凡 + 饵 x 的最小二乘直线，最佳拟合数据点为（2，1), (5,2), (7,3)，（8,3). 
解 利用数据的 x 坐标，构造 （ 1 ) 中的矩阵 X 和: y 坐标构造 向量 : v : 

"1 2i rr 

Y 1 5 2 

17 3 

18」 [3_ 

对的最小二乘解，得到法方程（用新记号） 


O 如果测量的余差是 t 而不是，在描点和计算回归直线之前只需交换数据（~，^)的坐标，如果两个坐标都有误差， 
你必须选择直线.使得数据点到直线的正交（垂 直） 距离平方和最小，见 7.5 节的练习题. 
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也就是说，计算 


X T X : 


'2 5 7 8 




2 5 7 8 


4 22 

22 142 


' 9 _ 
: 57 


标准方程是 


因此 


: 4 22 p 0 = _ 9" 

_22 142」[说 —57 


"^ol f 4 22T l T 9]_J_[142 -22] 「 9"|_ 1 ("24l_r 2/7l 
„aJ = 1.22 142 」 1_57 」 = 封 —22 4_| [_57 广耐 30 」 =|_5/14 」 


这样，最小二乘直线的方程为 + 见图 6-28. 

7 14 



ffl6 - 28 跡 二乘直线”冷 


在计算最小二乘直线之前，常见的练习是计算原来 X 值的平均 7 ，并形成一个新坐标 
/= x - I . 新的 X 坐标被称为平 均偏差 形式. 在这种情形下，设计矩阵的两列是正交的，像 6.5 
节的例4,标准方程的解是简化的，见习题17和习题 18. 

一般线性模型 

在一些应用中，必须将巧据点拟合为非直线形式，在下面的例子中，矩阵方程仍然是 
， 但不同问题的 X 会 〖从一 个问题变到下一个，统计学家常引人余差向量 e ，定义为 
e = y - xp ，并 且记作 

y = Xp+e 

任何具有这种形式的方程称为线性模型.一旦;(:和^被确定，为使 e 长度达到最小化，相当于 
找出叉月= 3>的最小二乘解，在每种情形下，最小二乘问题解為是下面标准方程 的解. 



~"I 产量水平 x I 树叶表面面积 x 

图 6-29 平均成本曲线 图 6-30 营养成分的产量 

解 理想的关系用方程 （3) 描述，假若实际的参数值为 A ), 总，氏，那么第一个数据点 
U ,^) 适合下列形式的方程 

y l =Po + ^ x l + p 2 x ^+ e l 

此处4是观测值％和预 测值: v 值汍+饵々+ 氏 〆 的余差，对每一个点集，我们可写出类似 
的方程. 

y> = p 0 + P1X1 + p 2 x^ +Et 
yz= Po + Pix 2 + p 2 x 2 2+e 2 

yn = Po+ PlX n + 02^1 +£„ 
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其他曲线的最小二乘拟合 

当“分散画出”的数据点 U ，％)， …，(々，>>„)不接近任何直线时，一个合适的假定是 x 和少具 
有其他函数关系. 

下面三个例子说明，如何将数据拟合为如下一般形式的曲线. 

y = Pofo(x) + PJ l (x) + ■■■ + p k f k (x) ( 2 ) 

此处/。，…，力是已知函数，汍是待定参数.下面将看到，方程 （2) 描述一个线性模型， 
因为它是未知参数的线性模型. 

对特殊的 x 值， （2) 式给出 >>的预测或“拟合”值，观测值与预测值之间的差为余差，参 
数 p 0 ，…， P t 的确定需满足余差平方之和最小. 

例2若数据点(^,)0,… , Cr „，>0 明显位于某条抛物线之上，而不是一条直线上.例如，如 
果 x 轴表示某公司的产量水平，而 >> 轴表示生产水平为每天 X 单位时的平均费用，那么一个典 
型的成本曲线看起来像开口向上的抛物线（见图 6-29), 在生态系统中，一个开口向下的抛物 
线常用于对一种植物中营养成分的净初始产量的建模，它是树叶表面面积的函数（见图 6-30). 
若我们用下列形式的方程逼近数据 

y = Po + p i x + p 2 x 2 (3) 

方程 （3) 给出描述数据的“最小二乘拟合”对应的线性模型. 
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可将上述方程组简单描述为 = 的形式，通过检査方程的前面几行和观察数据形状， 

我们可以求出 X . 



例 3 如果数据点具有如图 6-31 的模式，那么一个合适的模型是下面形式的方程 
y = Po + PiX + p 2 x 2 

这类数据可能来自公司的总成本，描述的是一个关于产量水平的函数，求线性模型并用最 
小二乘拟合这类数据 Uj ,)， …， u „，> o . 



解类似例2的分析，我们得到 

观测向量 设计矩阵 参数向量 余差向量 



V 


i & W 

xf 


—A» - 


V 

y = 

y2 

， x = 

1 ^2 Xl 

4 

， p = 

A 

仄 

， e = 

e 2 


入 


•1 x n x n 



A1 




多重回归 


假若一个实验包含两个独立变量（例如 M 和 V ) 和一个函数变量 （ 例如 y ). —个简单的通 
过《和 V 来预测: V 的方程有如下形式 

y = Pa + + p 2 v ( 4 ) 

更一般的预测方程具有下面的形式 

y = P 0 + p t u + p 2 v + PiU 2 + p t uv + p 5 v 2 (5) 

这个方程常用于地质学，例如，模拟地面侵蚀、冰川、土壤酸碱性以及其他数据.这种情 
形的最小二乘拟合称 为趋势曲面 . 

方程 （ 4 ) 和 （ 5 ) 都可以推出一个线性模型，因为它们是未知参数的线性关系（尽管《和 
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v 是乘法）.一般地，一个线性模型是指 y 可由下面方程来预测 
y = pofo(u,v) +A/i(«.v)+ •••+ p t f k (u,v) 

此处，/。,…, /* 是某类已知函数， A •，…，私是 未知权值. 

例4在地理学中，局部地形模型由数据(1 < ,,^,)，一，(1 4|1 义,; > >„)来构造，此处分别 
是地形的纬度，经度和髙度，描述基于方程 （4) 的线性模型且给出这些数据的最小二乘拟合， 
该解称为最小二乘平面.见图 6-32. 

解 我们希望数据满足下列 方程： 
y \ = Po + Pi ^ + Pzv , + e , 
yi — Po + PiUi + PxVi +E% 

y n = Po + P l u „ + p 2 v ll + e n 
这个方程组的矩阵形式是此处 


r T 

丨 H i T i 丨丨 l 

i pj T n 

图 6-32 最小二乘平面 


观测值 设计矩阵 参数向* 余差向纛 



， X = 

1 «1 v,' 

1 Ui V 2 

， P = 

Po 

A 

， € = 

^2 

入 


.1 v„ 


A 




例 4 表明，多重回归的线性模型和前面例题中的简单回归模型具有同样的抽象形式，线性 
代数为我们理解所有线性模型内在的一般原理提供了帮助，定义只要 X 适当，关于办的标准方 
程就具有相同的矩阵形式，不管包含多少变董_这样，对 x t a ■可逆的任何线性模型，最小二乘 
中的4总可由少计算得到. 


进一步阅读 

1994^°"' J ' Intr ° duCti0n t0 UnearAl S ebra in Geology (New York: Chapman & Hall, 

Krumbein, W. C., and F. A. Graybill, An Introduction to Statistical Models in Geoloev 
(New York: McGraw-Hill, 1965). 

Legendre, P., and L. Legendre, Numerical Ecology (Amsterdam: Elsevier, 1998). 
Unwin，David J., An Introduction to Trend Surface Analysis, Concepts and Techniques 
in Modem Geography, No. 5 (Norwich, England: Geo Books. 1975). 

练习题 


某产品的月销售额受季节波动影响，近似销售数据曲线具有以下形式： 
y-Po + PiX+p 2 sm(2nx/\2) 

这里 x 是按月统计的时间，凡 + 给出基本销售趋势，其中的正弦项反映季节对销售的影响，给出上面 

最小二乘拟合方程中，线性模型的设计矩阵和参数向量，假设数据是 
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习题 6.6 

在习题1~4中，求出最小二乘直线方程 
y = p 0 + P , x ， 其为给定下数据点的最佳拟合. 

1. (0,1 ) , ( 1,1 ) , ( 2,2) , ( 3,2) 

2. ( 1,0) , ( 2,1 ) , ( 4,2) , ( 5,3 ) 

3. ( -1,0) , (0,1) , ( 1,2) , (2,4) 

4. ( 2,3 ) , ( 3,2) , ( 5,1 ) , ( 6,0) 

5. 假设 X 是用最小二乘直线拟合数据, 
,-,( x „, y „) 对应得到的设计矩阵，利用 6.5 节的定 
理证明，标准方程具有惟一解的充分必要条件 
是： 数据中至少有两个数据点具有不同的 x 坐标. 

6. 若 X 是例2中最小二乘拟合抛物数据点 ( x„ yi X 

) 对应的一个设计矩阵，若々， A ，^是不 
同的数据，解释在最小二乘意义下，为什么只 
有一个最佳抛物拟合数据 （ 见习题5 ). 

7. 一个实验产生的数据为（ 1,1.8 ),( 2,2.7 ),( 3,3.4 ), 
( 4,3.8 ) 和 （ 5,3.9), 描述用下列函数形式生成 
的最小二乘拟合 模型： 

y = P，x + P 2 x 2 

这种函数会出现在这样的情形下，即当销售的 
总量影响产品的价格设定时，销售; c 单位产品 
的收益计算中. 

a . 给出设计矩阵、观测向量和未知参数向量. 

b . [ M ] 找出数据对应的最小二乘曲线. 

8. —个简单描述某公司花费变量的模型曲线，作为 
销售水平 x 时的函数，有如下形式 

y = P ， x + P 2 x 2 + P 3 x 3 

由于不包含固定花费，所以没有常数项. 

a . 对于数据(^…，…，(^，^，给出线性模型的 
最小二乘拟合方程对应的设计矩阵和参数 
向量. 

b . [ M ] 求出最小二乘曲线拟合 数据： （4,1.58) , 
( 6,2.08 ) , ( 8,2.5 ) , ( 10,2.8 ) , ( 12,3.1 )， 

(14,3.4), ( 16,3.8), ( 18,4.32), 有数千个 
数据，如果可能，画图说明数据点和立方近 


9. 某一实验得到的数据为 （1,7.9 )， （ 2,5.4 ) ^ 
( 3, -0.9 ), 描述由下列形式的函数拟合这些数据 
产生的最小二乘模型. 

y = Acosx + Bsinx 

10. 若放射性物质 A 和 B 分别具有衰变常数 0.02 
和 0.07, 如果一个含两种物质的混合物，在时 
刻；= 0时，包含 A 物质 A 克和 B 物质 M 8 克， 
那么在时刻；，混合物中总量 y 的模 型是： 

y = ( 6 ) 

若初始含量 M A 和 M B 未知，但在几个时刻，科 
学家可以测得并记录到下列时刻和含量的数据 
(;,•，％):( 10,21.34)， （ 11,20.68) ，（ 12,20.05)， 
(14, 18.87) 和 （ 15, 18.30). 

a . 描述可以估计的线性模型. 

b . [ M ] 找出基于方程 （ 6) 的最小二乘曲线. 

11. [ M ] 根据开普勒第一定律 ，一 个彗星 ( 见图 6-33 ) 
应该有椭圆、抛物线和双曲轨道 （ 当行星的引 
力可以忽略时）.对合适的极坐标，一个彗星 
的位置 （ r ,0) 适合下面形式的 方程： 

r= p + e(r.cos^) 

此处0是常数， e 是轨道的离心率，当 0< e<l 
时对应椭圆 ， e = l 时对应抛物线， e > l 时对应 
双曲线，若新观测出现的彗星有下列数据，确 
定轨道的类型并预测当 t ? = 4.6 (弧度）时彗星 
的位置 0 



0.88 

1.10 

1.42 

1.77 

2.14 

r 

3.00 

2.30 

1.65 

1.25 

1.01 


© 用最小二乘解拟合数据的基本思想来自 k. F. Gauss 
( 同时还有 A. Legendre 的独立工作），最早是在 
1801年，他用这种方法确足星状的谷柙星的轨 
迹，当谷神星被发现40天后，它消失在太阳后 
面， Gauss 预测10个月之后它会重新出现且他给 


出谷神星的具体位置，精确的预测震惊了欧洲的 
科学界. 


似的图形. 
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图 6-33 上一次出现于1986年的哈雷彗 
星，它将再次出现于2061年 
12. [ M ] 健康儿童的心脏收缩压 p ( 毫米水 银柱） 和 
体重 w (镑）之间的近似关系满足方程 
/3 0 + /3 i In *v = p 

利用下面实验数据估计健康儿童体重为100镑 
时的心脏收缩压. 


w 

44 

61 

81 

113 

131 

In iv 

3.78 

4.11 

4.41 

4.73 

4.88 

P 

91 

98 

103 

110 

112 


13. [ M ] 为测* 飞机起飞表演，飞机的水平位置从 
r = 0 到 f = 12 每秒测量一次，具体位置（英 尺） 
是： 0, 8.8, 29.9,62.0,104.7,159.1, 222.0, 294.5, 
380.4, 471.1, 571.7, 686.8, 809.2. 

a . 求出这些数据的最小二乘立方曲线 

y=Po + Ptt+Pit 1 + p,t 3 . 

b . 利用 < a ) 的结果估计当 t = 4.5 秒时飞机的 
水平速度. 

14- 令以 (為+… 

+■*») 和 y =-( yi +---+ y .) • ® 
n n 

明： 数据 U , 的最小二领通 
过 （ H ). 也就是证明 i 和7适合线性方程 
v = p B + $, x . 从向量方程 _y = X /5+ e 导 

出这个方程.将 X 的第一列表示为1 ’利用余差向 
量£与 X 的列空间正交的事实得到它正交于1 J 
给定数据的最小二.乘问题. U . y ,). , 

下列缩写符号很 有用： 

X j:= X-* 2 = X ^ ,ji * 2 


最小二乘直线 y = Po + 艮 X 的标准方程可以写成 
n0o+ = ( 7 , 

15. 对应标准方程 （7), 导出本节给定的矩阵形式. 

16. 利用矩阵的逆求解方程组 （ 7 ), 然后确定许多 
统计课本中出现的计算 戌和戍 的公式. 

17. a . 用新坐标的平均偏差形式，重写例1中的 

数据，设 X 是对应的设计矩阵.说明为什么 
X 的列是正交的. 

b . 写出 ( a ) 部分中数据的标准方程.并求解得到 
最小二乘直线 y = ^ + ^x ,此处 
x=x-5.5. 

18. 若数据 ( JtijiWJt ,,) 1 *) 的 Jt 坐标是平均偏差 
形式，所以 $>,• = 0 ,证明如果 X 是这种情形 
下最小二乘直线的设计矩阵，那么是正 
交矩阵. 

习题19 ~ 20包含具有2列或更多列的设计矩 
阵， iS 是 _k = X 办的最小二乘解，考虑下 列数： 

( i ) \ x$f 一一 “回归项”的平方和，记该数 
为 SS ( R ). 

( ii ) \\ y - X 0 f —误差项的平方和，记该数为 
SS ( E )- 

( iii ) —坐标 y 平方之和的“总和”，记 
该数为 SS (. T ) : 

每一本讨论回归和线性模型 y = Xp + e 的统 
计课本都引人这些数，尽管术语和记号会有变化， 
为简单起见，假设 y 的平均值是零,在这种情形下， 
sscn 与被称为; v 值集合的方差成正比. 

19. 验证方程 SS ( r ) =_ SS (/?) + SS (£) (提 示： 利用一 
个定_解释为什么定理的假设成立）.这个方程 
在统计学中的回归理论和方差分析中非常重要. 

20. 证明： | x / Sf =4 T x T >-. (提 示： 重写方程左 
边并且利用满足标准方程的事实 .） 关于 
SS ( lf ) 的这个公式被用在统计学上，从这个结 
论和习题19可得最小二乘误差的标准 公式： 

SS ( E ) = y T y - fi T X T y 
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练习题答案 

我们必须构造 X 和月，使得;的第 it 行是对应数据（4，>)的预测 y 值，记为： 


Po + P t x k + p 2 sin ( 2 nx k /\ 2 ) 



图 6-34 具有季节性波动的销售趋势 


6.7 内积空间 

长度，距离和正交性的概念在向量空间中有非常重要的应用，对 R " 空间，这些概念基于 
6.1 节定理1中列出的内积性质.对其他空间，我们需要类似的内积和同样的性质，定理1中的 
结论成为下面定义中的公理. 

定义 向量空间 V 上的内积是一个函数，对每一对属于 V 的向量，存在一个实数〈„，0 
满足下面公理，对任意属于 V 的 K, V， W 和所有数 C: 

1- ( u , v ) = { v , u ) - 

2- 〈K + V ， W 〉 = 〈 K,W 〉 + 〈 V ， W〉• 

3. { cu , v ) = c { u , v ). 

4. 且 < K ， K 〉=0 的充分必要条件是 K =0. 

一个賦予上面内积的向量空间称 为内积 空间. 

具有标准内积的向量空间 IT 是一个内积空间，而且本章几乎所有 1 T 空间上的讨论都在内 
积空间上.本节和 6.8 节的例子给出许多基础应用实例，涉及工程、物理、数学和统计等课程. 
例 1给定两个正整数（例如4和 5) 及 K 2 中向量《 = ( «,，《 2) 和 v = (Vl , V2) ，规定 

(m,v) = 4 m , v , +5 m 2 v 2 (1) 

说明 （ n 定义了一个内积. 

解 当然，公理1满足，因为 

( m , v ) = 4 m , v , +5 m 2 v 2 =4 v , m , +5 v 2 m 2 ={v,u) 

如果 w =( w ,, w 2 ), 那么 
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(u+V y w) = 4(u x +V|)H^ +5(m 2 +v 2 )w 2 

= 4u x Wi +5m 2 w 2 +4viWi +5v 2 w 2 
= ( w , w ) + ( v , w ) 

这就验证了公理2,对公理3,我们有 

( cw , v ) = 4( c « i)vi + 5( cm 2 ) v 2 

= c (4 «iVi +5 m 2 v 2 ) = c(u,v) 

对公理 4, 注意 〈《，《>=4 Ml 2 +5 M 2 2 >(^.4 Mi 2 +5 M 2 2 =0, 当且仅当岣=« 2 =0时成立，即 w =0, 此 
夕卜，〈0,0>=0,所以 （1) 定义了 1 R 2 上的内积. _ 

类似 （ 1 ) 可在 K " 上定义内积，他们自然和“带权值的最小二乘”问题联系起来.此时， 
权值可赋给内积中和式的各个分量，且这种方式对较重要的分量给予更可靠的权值. 

从现在起，当内积空间包含多项式或其他函数时，我们可用悉熟的方式写出函数，而不用 
黑体表示向量，然而，必须要记住，当它作为向量空间一个元素时每个函数表示的是一个向量. 
例2设 L …山是不同的实数，对属于 P „ 中的/>和 9 ,定义 

{p,q) = p{h)q{h) + p{U )q(t i ) + ••• + p(t„ )q{t „) (2) 

很容易验证内积公理的1~3,对公理4,注意 

(p^p) = lp(h)f +[p(h)V + ■■■+[p(h)f ^0 

也有 〈0,0〉=0.( 我们仍用黑体 0 表示零多项式，它是 P „ 中的零向量 •） 如果 〈 A p >=0, 那么 p — 
定在 n + 1 个点 r 0 , …山处为零，这时 P 只能是零多项式，因为 P 的次数小于 7 J + 1， 从而 （2) 定 
义了 P „ i 的一个内积. ■ 

例3设 V 属于 P 2 , 且 V 具有例 2 中的内积，其中 =0, r , 和 =1. 设冲 ) = 12 f 和洲 = 2 f - l . 
计算〈料〉和〈料〉 • 

解 

{pq) = p(0)q{0) + # [去 >[ 去 )+ p ⑴ 9 ⑴ 

= (0)(-1)+ (3)(0)+ (12)(1) = 12 

〈"〉=[《(0)] 2 +[<去】+[9(1)] 2 

=(-1) 2 +(0) 2 +(1) 2 =2 ■ 

长度、距离和正交性 

设 V 是一个内积空间，其内积记作 〈 K ， v >, 像 K " 空间一样.我们定义一个向量的长度或范 
数是数 

即 ||vf =〈 V ， V 〉 （这个定义有意义，因为 〈 V ， V 〉>0, 但这个意义并不是说 〈 v ， v > 是一个‘‘平方之和”， 
因为 V 不必是 1 T 中的元素）. ’ 
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一个单位向置是长度为1的向量，向置 K 和 V 之间的距离是 | k _ v | ， 向量 K 和向量 V 正交， 
如果 〈 K ， V 〉=0 成立 . 

例4若？ 2 具有例3中的形式 （ 2) 的内积，计算向量 〆 0 = 12r 2 和 〆 r)=2r-l 的长度 • 

解 

IHI 2 = 〈 W>=[P(0)] 2 +[/^|+[Ml)] 2 =0 + [3P + [12?=153 

wi=v^ 

在例 3 中，我们知道 {q,q) = 2 ,因此||《| = V2 . ■ 

格拉姆-施密特方法 


内积空间中有限维子空间的正交基的存在性，可由格拉姆-施密特方法确定，像 K " 空间一 
样.应用中经常出现的一些正交基可用这个方法构造. 

一个向量在一个具有正交基的子空间 W 上的正交投影，可像平常一样构造.投影不依靠正 
交基的选取，并且它们有正交分解定理和最佳逼近定理所描述的性质. 

例5若 V 是具有例2中内积的 P 4 ，包含多项式在 -2, -1, 0, 1和2处的值，且？ 2 作为 V 
的一个子空间，应用格拉姆-施密特方法于多项式1, r 和构造 P 2 W —个正交基. 

解内积仅依赖于多项式在-2, -1, 0, 1和2的值，所以我们列出每个多项式作为 K 5 空 
间的值，写在多项式的下面： 0 


多 项式： 

Y 


t 


/• 

向 量值： 

1 

1 


—l 

0 


1 

0 


1 

1 


1 

2 


1 

4 - 


V 中两个多项式的内积等于它们对应向量在 R 5 空间的标准内积.注意 r 与常数函数1正交，所 
以取⑴=1和巧⑴二/,对巧，利用 R 5 中的向量，计算 P 在 Spanfp 。，/^ 上的投影. 

( r 2 , p 0 > = ( r 2 , l > = 4+1+0+1 + 4 = 10 
(Po ， Po)=5 

( t \ p ,) = ( t \ t ) = -S + (- l ) + 0 +l + S = 0 
r 2 在 Span{U} 上的正交投影是 | 内 +0. 仍， 这样 


V 的子空间 P 2 的一个正交 基是: 


G 中的每个多项式被其在5个 f 值-2, - 1 , 0, 1和2上的取值惟一确定.事实上， p 和它的向量值的对应关系是 

一种同构关系亦即是保持线性组合关系的一对一映上到 R 5 的映射. 
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多 项式： P 。 p, p 2 



3) 


内积空间的最佳逼近 


应用数学中最常见的问题，包括元素是函数的向量空间，主要是在 V 的特定子空间 W 中， 
选取函数 g 来逼近 V 中的函数 /. 对/的“逼近”程度依赖1/ 1|| 定义的方式，我们仅考虑/和 
g 的距离用内积定义的情形，在此情形下，/由 W 中函数的最佳逼近是指/在子空间撕上的正 
交投影. 

例6设 V 是 R 具有例5中定义的内积，/7。,/7 1 和/7 2 是例5中的子空间1» 2 的正交基，求出 

P 2 中的多项式对 p ( t ) = 5-- t A 的最佳逼近. 

2 

解 P 。， 巧和 巧对应 f 为-2, -1 ， 0， 1 和2的值以 R 5 中向量的形式 在上面 （ 3 )中 已经给 
出， p 的相应值是-3，9/2, 5, 9/2和 -3, 我们 计算： 

(p»Po) =8, ( p , pi )=0, ( p , p 2 ) =-31 

( po , Po ) = 5, 〈 p 2 ， p 2 >= 14 

所以， P 2 中的多项式对 V 中 p 的最佳逼近是 


P = Projft p 


_ (p<Po ).. 
(Po,Po) P ° 


I ( P ， P '、 p ' , 

(PuPl) (P 2 ,P 2 ) 


P 2 


当多项式之间的距离仅用 r 为-2, -1， 0, 1和2时的值来度量时，这是 P 2 的所有多项式中离 p 
最接近的多项式，见图 6-35. 



图 6-35 
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例5和例6中的多项式内,仍和仍属于一类多项式，在统计学上称为正交多项式戸正交性 
是指例2中描述的内积类型. 

两个不等式 

给定内积空间中的向量 v 和给定的有限维子空间灰.我 
们将勾股定理应用到相对 VV 的正交分解中，可以 得到： 

IH| J =||proj w v|| 2 +|v-proj w v| 2 

见图 6-36, 特别地，这表明 v 到 W 上投影的范数，不超过 v 自 
己的范数，这个简单事实可推出下面重要的不等式. 

定理16 (柯西-施瓦茨不等式） 

对空间 V 中任意向量 u 和 v ，有 

|<«,v>|$||«|| |v|| (4) 

证如果《 = 0,方程 （4) 的两边都是零，且这种情形下 （4) 式成立（见练习题 1) •如 
果《*0,若 W 是“生 成的子空间，注意 |«/| = | c | || u || 对任何数 c 都成立.因此 



由于 ||pro>v|^|v||, 我们得到1^1 < | v || ，即给出 （ 4 > 式. _ 

Irll 

柯西-施瓦茨不等式在很多数学分支都很有用，习题中有几个简单 应用. 这里我们主要利用 
它证明另一个包含向量范数的基本不等式.见图 6-37. 



图 6-37 三角形边的长度 


定理17 (三角不等式） 

对属于 V 的所有向量 K ， v ， 有 

||« + v|<||h||+||v| 



John Wiley & Sons , *964 ) • pp . 424 A 6. pp _ 43( M 3〗 的表格列出的“正交多项式”，是指多项式在-2, 


，2处的值. 
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证 | M+V | 2 =<«+ v ,«+ v ) =<«,«) + 2( tt , v ) + < v , v ) 

<IHI 2 +2|<«,v)| + h 2 

< |«|| 2 +2||«|||| v | + | v || 2 柯西-施瓦茨不等式 

=(WI+H ) 2 

两边开方后，立刻得到三角不等式. 


C [ a , fc ] 上的一 个内积（霈要微积分知识） 

也许应用最广泛的内积空间是区间上所有连续函数构成的向量空间 C [ a , fc ]， 且具 
有下面定义的内积. 

首先考虑多项式 P ， 及大于或等于 p 的阶数 n 的任何整数，则有 p 属于 P „, 我们可以利用 
例2中的内积计算“长度”，注意 p 包含 kfc ] 中 (n + 1) 个点.然而，这种 p 的长度仅保留这 (n + 1) 
个点的特性，一般地，对 p 属于 P » 的所有 n ， 我们可以利用更大的数《，更多的求值点计算对 
应的内积.见图 6-38. 



图 6-38 利用 [ a ， W 内不同数目的求值点计算 ||/f 


我们用 （n + 1) 个长度为 Af = ( fc - a)/(n + l ) 的子区间分割 [a,b\ , 并且使 W ••山是这些子区间 
中的任意点. 


如果《很大，由 f 。， …人确定的关于1?„的内积将趋向较大的数化，/^，所以需要重新度量， 
并将内积除以（《 + 1)，注意到 l/(n + l ) = Af /( fc - a ) ， 定义： 


〈/ m > =客 MO ⑺[客池 ) 祇) Af 


现在，让《无限制增加，由于多项式是连续函数，括号内的表达式是一个黎曼和且趋 
向一个定积分，考虑/^)以0在 [ a ， fc ] 上的平 均值： 


-^—\ b p{t)q{t)At 
b — a J a 

这个数值对任意阶多项式都有定义 （ 事实上是对所有连续函数），且它具有像下面例题所说 
的全部内积性质，前面的因子 i /( fc - a ) 不是必需的，为简化下面的计算常省略. 

例7对 Ckfc ] 中的 /， g ， 取 
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( f , g )= j b a m g ( t)dt (5) 

这证明 （ 5 ) 定义了 C [ a ，《 上的内积. 

解内积公理1~3可由积分的基本性质得出，对公理4,注意到 

函数 [/( f )] 2 在 [ a ， 《上连续且非负，如果 [/( f )]° 2 的定积分为零，那么由髙等微积分的定理可知， 
[/( f )] 2 在 [ a ，《 上必须恒等于零.从而/是一个零函数，〈/，/>=0意味着/是[仏6]上的零函数， 
也就是 （5) 定义了一个 [ a , 幻上的内积. ■ 

例8设 V 表示内积用例7定义的内积空间 C [0,1], W 是多项式仍(0 = 1,^(0 = 2t-im Pi (t) = l2t 2 
所生成的子空间，利用格拉姆-施密特方法，求 W 的一个正交基. 

解取 9 ,=仍，并且计算 

</^2, 9. > = j o ' (2 f - l )( l)df = ( f 2 - f ) | i = 0 

这样已经与屮正交，所以可取仍=/?2.对/?3在 = Span { a , g 2 } 的投影，我们计算 

(puqi) = j' o l2t 2 - Idt = 4t } \l = 4 

(q t ,q t ) = j\.ldt = t\' 0 =l 

{Pi,q 2 ) = I2t 2 (2t - l)df = (24 f 3 - 12 f 2 ) d / = 2 

(q2,q2) = j o (2t-l) df = 士 (2 卜 l) 3 |i = 全 

那么 

pro}w,p 3 = 〈〈 : 3 ’f 〉〉 A + g2 =Ygi+^g2 =4 屮 +6 仍 

93 = Pi -proj^Ps = Pi -4^i - 6 q 2 

作为一个函数，奶 ( f ) = 12 f 2 -4-6(2 f - l ) = 12 f 2 -12 f + 2, 子空间 W 的正交基是 {%, 仍，仍 }• ■ 


练习题 


利用内积公理验证下列论断. 

1. (v,0> = (0,v> = 0 

2. (w,v + w) = (w,v) + (u,w) 

习题 6.7 

1 . 在 R 2 空间中取例 1 定义的内积， x = (l,l) , 
^ = (5-1). 

a- 计算 |x|，|b| 和 lUWl 2 . 

b. 描述所有与 j 正交的向量 （z,,z：0 . 

2. 在 R 2 空间中取例1定义的内积，说明柯西-施 
瓦茨不等式，对1 = (3,-2) 和少= (-2,1) 成立. 


(建 议： 研究 

习题3~8中的多项式属于朽且计算内积时 f 
取值为-1，0和 1. (见例 2.) 

3. 计算 此处 p(r) = 4 + r, 抑 ) = 5-4r 2 . 

4. 计算此处尸(0 = 3卜^ 2 ,《(0 = 3 + 2^ 2 . 

5. 计算 ||_p|| 和 |M|， 其中 P，9 如习题 3. 
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6. 计算 || p || 和 IMI ， 其中9如习题 4 . 

7. 计算 9 在/7所生成子空间上的正交投影，其中 
p ， q 如习题 3. 

8. 计算 9 在 ？ 所生成子空间上的正交投影，其中 
p ，分如习题 4. 

9. 设/> 3 计算内积时 r 取值为-3, -1，1和3,取 
Po(o = i , pM=t fn p 2 ( o = t 2 . 

a . 计算 P 2 在 P 。 和 P , 生成的子空间上的正交投影. 

b . 求一个与 P 。 和 Pl 都正交的多项式 9 ，使得 
{ Po ， Pi,W 是 Span { p 0 , Pi , P2 ) 的一个正交基， 
重新度量多项式？，使得它在 （ -3,-1,1,3) 处 
的向量值是 （ 1 ， -1 ， -1 ， 1). 

10. 若 P , 具有习题9中定义的内积，且多项式 
尸 0 ,仍4也如习题9定义，求 Spantp 。，/^} 中 
的多项式对 = P 的最佳逼近. 

11. 若和巧是例5中给出的正交多项式，且计 
箅 P 4 的内积时 f 取值为-2,-1,0，1和 2. 求 r 3 在 
Span { po , Pi , P 2) 上的正交投影. 

12. 求一个 多项式 p 3 ，使得 {po ， Pi ， p 2 ,p 3 i (见习题 
11 ) 是 1» 4 中子空间巧的正交基，重新度量多 
项式仍，使得它的向量值是 （ -1,2, 0, -2,1). 

13. 设 A 是任何 nxn 可逆矩阵，说明对1!?"中《和 
v , 公式 («, v ) = ( Au ) - ( Av ) = (Auf - ( Av ) 定义了 
一个 IT 上的内积. 

14. 若 r 是从向量空间 V 到 R " 的一对一线性变 
换，证明对 V 中的《和 v ,公式 

定义了 V 上的一个内积. 
利用本节内积公理和其他结果去验证习题 
15-18 的命题. 

15. 验证 〈《, cv >= c 〈《， v > 对所有数 c 都成立. 

16. 如果 {«， v } 是 V 中的单位正交集，那么 

|«-v| = V5. 


I 7 . («,v) = i||« + v|| 2 -^||«-v|| 2 . 

is - ii « + vir + i «- vir =2 Hi 2 + 2| vr . 

19. 给定00和设《 和 v = ， 

利用柯西-施瓦茨不等式比较几何平均值 
•Job 和算术平均值 (fl + fc )/2. 

20. a « = ^ Jfq v = ^ J , 利用柯西-施瓦茨不等式 

证明[宁)、午. 

习题21~24的空间指的是 V = C [0,1] ,其内积 
如例7所示用一个积分给出. 

21. 计算 〈/ j 〉， 此处 /( r ) = l -3 r 2 ， g ( t ) = t - t \ 

22. 计算〈/』>,此处 /( r )=5 r -3, g ( t ) = t } - t 2 . 

23. 计算习题21中/的 ||/|. 

24. 计算习题22中 g 的 M |. 

25. 设 V 是具有例7中定义的内积，空间 C [- l ， l ], 
求由多项式1, r 和 P 所生成的子空间的正交 
基.这个基中的多项式称为勒 让德多项式. 

26. 设 V 是具有例7中定义的内积，空间 C [-2,2], 求 
由多项式1, r 和 r 2 所生成的子空间的一个正交基. 

27. [ M ] 设 P 4 具有例5中定义的内积，且外，仍, p 2 
是该例中的正交多项式，利用矩阵程序，将格 
拉姆-施密特方法用于集合{风，内，朽,构 
造恥的一个正交基. 

28. [ M ] 设 V 是具有例7中定义的内积，空间 
C [0,2 jt ] ，利用格拉姆-施密特方法构造由 
{ l , cosr,cos 2 r,cos 3 r ) 所生成的子空间的一个正 
交基，利用矩阵程序或计算程序来计算相应的 
定积分. 


练习题答案 

1. 由公理 1, (v,0> = (0,v> ,那么〈0,0 =〈加,》>> = 0<»>,»>>，由公理3,得到 〈0，v> = 0. 

2. 由公理 1 和2，再由公理 1，得 〈《，v+ »*>> = 〈V + »*>，《> =〈v，《> + 〈》*>，《> =〈《，v> +〈《，》>>. 
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6.8 内积空间的应用 

本节的例题说明 6 _ 7 节定义的内积空间，如何应用在实际问题中，第一个例子是本章介绍 
中的例子，它是调整北美地质数据问题中，出现的巨型最小二乘问题. 

加权最小二乘法 


设向量_^的《次观测值为; y , ，••_，)；„，且假设我们希望，用属于 R » 的特定子空间中一个向量$ 
逼近 ： y (在6_5节，被写成 Ar ， 所以属于4的列空间）.记的分量为 5 ;,，…，义，那么误 
差的平方和或怒(£)，用_?逼近 3 >后，得到 

55(£') = ( y 1 - y ,) 2 +••• + (%-%) 2 (1) 

利用 5 T 的标准长度的写法，上式可简记为|| 3 >-列 2 . 

现在，假设测量时； y 的各个分量的可靠性不同（这是北美地质资料的一个特点，因为测量 
的数据是140年前的，作为另一个例子，： y 的分量的计算来自各种样本的测量和不同样本的大 
小）’那么可靠性就变成 （ 1 ) 式中平方误差的适当权值，较可靠的测量应赋予更重要的作用戸 
如果权值记为 w x \---, wl ,那么加权的误差平方和是 

加权 SS ( E ) = w ^( y - y ,) 2 + ■■■ + wl ( y n - y „) 2 ( 2 ) 

这是长度的平方，此处的长度类似6/7节例1中定义的内积，记为 
(x,y) = + 

有时，可以非常方便地将这种加权最小二乘问题变换为等价的普通最小二乘问题，设撕是 
对角线上是非负数*的对角矩阵，可得： 



={w l y j -w j y j ) 2 

可见 （ 2 ) 式中加权的 幻就是 5T 中町-呵普通长度的平方’它可以写成 

现在假设向量的逼近是由矩阵4的列构成的，我们寻找一个 使得必 尽可能接近 
3 1 -然而，逼近的度量是含权的 误差： 


这样 i 是方程 


||Wy-H$|| 2 =\\Wy-WAx\\ 2 
WAx = Wy 


有统计学知賴读者注意：辟 >>,. 的触縣麵立醜变量，且均值料，方差分别为心 ., CT 〗， ⑵中适当 
的权值是 1/ CT , 2 ， 较大的方差误差，对应较小的权值. 
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的普通最小二乘解，此最小二乘问题的标准方程是： 

(闕 T W4jc = (WA) t H^ 

例1求最小二乘直线^ = )3。+ )^，最佳拟合数据为(_2,3)，(-1， 5 )，(0, 5 )，(1,4)，(2,3)，假设后 
面两组数据中， y 值测量的误差比其余数据的误差大，这些数据的权值只有其余数据权值的 
一半. 

解如 6.6 节所示，写出矩阵4对应的 X ，向量: c 对应我们 得到： 



p - 2 1 



y 

x = 

1 -1 

1 0 

1 1 


y = 

5 

5 

4 


1 2 



3 


对权矩阵，选取 W 的对角线值为2, 2, 2，1和 1. 对 X 的行和 j 分别左乘 W ， 得到： 


"2 -4' 


V 

2-2 


10 

2 0 


10 

1 1 


4 

1 2 


3 


对于标准方程，计算 

(WX) T WX=^ U g (WX) T H>=^j 

并且求解 

U 4 淵 =u] 

标准方程的解（精确到2位有效数字）是)3。 =4.3 和 A =0.20,期望的直线是); = 4.3 + 0.2( k . 
相反，这些数据的普通最小二乘直线是 ; y = 4.0-0.10; c . 两条直线都显示在图 6-39 中. 


y 



图 6-39 带权值和普通的最小二乘直线 


■ 
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数据趋势分析 

若特定函数/仅知道在点?。， …山 处的值（也许是近似值），如果数据 /( f D) ，...， /(0 有一个 
线性趋势，那么我们期望用形如 jSo + Af 的函数得到/的近似值.如果有一个“二次趋势”，那 
么我们会尝试用形如^ + )^ + )3 〆 的函数.这就是不同的观点下，在 6.6 节已讨论过的函数. 

在某些统计问题中，将线性趋势从二次趋势（也许三次或高阶趋势）中分离出来非常重要. 
例如，工程师正在分析新车的性能，而/(0表示 f 时刻汽车和一些参照点的距离，如果汽车以 
常速连续行驶，那么/(0的图像应该是直线且斜率表示速度，如果突然踩下油门，/(0的图像 
将改变为包含二次项和三次项（由于加速的原因）.又例如，当分析一辆汽车超过另一辆汽车 
的能力时，工程师就会希望将二次或三次项从一次项中分离出来. 

如果一个函数由形如7 =队 + ) ^ +) 3/的函数来逼近， 系数仄 也许不能给出期望的二次趋 
向数据，原因是在统计学意义下，它和其他汉相关，为进行所谓数据的趋势分析，类似 6. 7节 
的例2,我们引人空间]?„上的内积，对属于巧的/^定义： 

( p , q ) = Pih ) q { h ) + ••• + p ( t „ ) q { t n ) 

实际上，统计学家很少需要考虑阶数高于三次或四次的趋势.所以，假设 ，仍表 示 
P ” 的子空间聆的正交基，它可以将多项式 U , f 2 和 f 3 通过格拉姆-施密特正交化方法得到.利用 
第2章习题11的补充材料，存在一个属于]?„的多项式 g ，它在，…；处的值与未知函数/处 
的值一致.若 g 是尽在聆上的正交投影（相对于给定的内积），则 
8 =c Q p 0 +c i p i +c 2 p 2 +c 3 /? 3 

那， g 称为数据的立方趋势 函数， c D ,... ， c 3 称为数据的趋势 系数 . 其中系数 C, 表示线性趋势， c 2 
表示二次趋势，^表示立方趋势.结果是如果数据具有某些性质，这些系数相互独立. 

由于广…，仍是正交的，（注意趋势系数可逐次计算且相互独立.如果我 
们仅需要二次趋势，我们可以忽略仍和 C 3 _ 例如，如果我们需要确定四次趋势，我们仅需要计 
寞 ( g ， p *)/{ p “ PA ， 找到一个与 P 3 正交且属于的多项式(通过格拉姆-施密特方法）. 

例2最简单且最重要的趋势分析是点 f D , …丄被调整后，它们均勻分布且总和为零，用二 
次函数拟合数据 (-2,3),(-1,5),(0,5),(1,4), (2,3). 

解对 6.7 节中例5的正交多项式的 f 坐标重新度量，我们可得 


多 项式： p 0 pi P 2 数据 ： g 



计算仅包含这些向量，没有涉及特别的正交多项式公式，在多项式空间 p 2 中，数据的最佳拟合 
是下面给出的最佳投彭. 
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(Po,Po) (PuP 


> + t 


P 2) 


20 1 7 

=^ Po ~To p '~Ta P2 


p ( f ) = 4-0.1 f -0.5( f 2 -2) (3) 

由于 p 2 的系数不是足够小，一个合理的结果是趋势至少是 二次. 这个结论可从图 6-40 得到 验证. 



傅里叶级数（霈要微积分知识） 


连续函数常用正弦和余弦函数的线性组合来逼近，例如，一个连续函数可以表示一个声波， 
某类电信号或力学振动系统的运动等. 

为简单起见，我们考虑<271上的函数，结果是任何 C [0,271] 上的函数可以由下列形式 
的函数任意逼近 


Oo 

T 


+ 岣 cos f + ... + cos nf + sin f + • * • + sin nt 


(4) 


如果自然数 《 足够大. （4) 中的函数称为三角多项式，如果〜和纥不同时为零，多项式称为是 
«阶的，三角多项式和 C [0,2 tc ] 上的其他函数之间的联系依赖下列事实.对任何集合 
{1, cos t , cos 2 f , • * • , cos nt , sin t , sin 2 f , • • •, sin nt ] ( 5 ) 


对下面定义的内积是正 交的： 


</.g) = j 0 2 V(Og(Od/ 


( 6 ) 


这个正交性可从下面的例题和习题5和习题6得到验证. 


例3空间 C [0,2 ti ] 具有形如 （6) 的内积，并且 m 和 n 是不相等的正整数.证明 cosmf 和 cosnf 


正交. 

解 我们利用三角恒等式，如果有 
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{cosmt,cosnt) = 


cos mtcosntdt 



[cos(/nr + nt)-\- cos(mt - nt)] dt 



■ 


设 H / 是 C [0,2 n ] 中的子空间且由 （5) 中的函数所生成，对 C [0,2 n ] 中的函数 /， W 中关于 / 的 
最佳逼近称为/的/1阶傅里叶通近.由于 （5) 中的函数是正交的，给出的最佳逼近是 W 上的 
正交投影，在这种情形下， （4) 式中的系数称为/的傅里叶系数.标准的正交投影公式表明： 
= _Jl ， _coskt ) ，、=」 /，_ ’ k>l 

(cos kt, coskt) 〈sin &， sin At〉 

习题 7 要求你证明 〈 cosfcr ， cosfcr > = n *< sinAt ， sinA : f 〉= n ， 那么 


a k =丄 f 2lt / ⑴ cosfcfdf ， b k =丄 f 2n /(f)sintok 

tc jo n Jo 

( 常数）函数 i 的系数的正交投 影是： 

:= 士广 f 

此处《。是 （7) 式中 fc =0 的情形，这就解释了 （4) 中的常数项为什么写成《。/2. 
例4求函数/⑴= ? 在区间 [0, 2 ji ] 上的《阶傅里叶逼近. 

解 我们计算 


^= i . ir t d t ： 

2 2 7 t J » 


当 fc >0 时，利用分部积分 




coshdr = — —cos^r+-sin^ =0 


1 f 2tt 11 t I 

b k =— fsintdf = _ — sin kt -一 coskt 

^ jo n[k 2 k J 

这样，/(0 = ?的《阶傅里叶逼近是 


图 6-41 表示/的3阶和4阶傅里叶逼近. 


■ 


函数/与傅里叶逼近之差的范数称为逼近的均方误差.（术语“均”是相对于积分定义的范数 
而言的 .） 可以证明，当傅里叶级数的阶数增加时，均方误差趋于零，由于这个原因，它常常写成 
/(0 = y + S («m cosOTf+fc m sin mt) 

这个 /(0 的表达式称为 / 在 [0,27 t ] 上的傅 i 叶级数.例如，项 ^ cos 时是/在由 cosmf 生成的一 
维子空间的投影. 
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b)4 阶逼近 
图 6-41 函数 f { t )= t 的傅里叶逼近 


练习题 

1. 设9,(0 = 1,心(0 = ?和9 3 (0 = 3; 2 -4, 验证 {中 , 92 , 93 }是(：[-2,2]上的正 交集，内积具有 6.7 节例 7 的形式. 

2. 求下列函数的 1 阶和 3 阶傅里叶 逼近： 

/(0 = 3-2sinr + 5sin 2r-6cos2r 


习题 6.8 

1. 求最小二乘直线 .v = A) + A^ ,最佳拟合数据 
(-2,0)，(_1,0),(0,2),(1,4)和 (2,4) ,若第一个和最 
后•个数据具有较小的 sf 靠性，权值取中间三 
个数据的一半. 

2. 假若加权最小二乘问题中 ， 25 个数据里有 5 个 
数据具有的），度量且比其他数据的可靠性小， 
这些数据的权值被赋予其他20个数据权值的一 
半.其中•个方法是20个数据的权值为 1, 其 
余 5 个数据的权值为另一个方法是 20 个数 

据权值为2,其余5个数据的权值为 1. 这两种 
方法结果一致吗9试解释之. 

3. 用 二次趋 势函数拟合例2中的数据，三次正交 

多项式是灼(0=& 3 -2/. 

6 6 

4. 为给出6个等分数据点的趋势分析，可以用 
r = -5，-3，-l， 1，3和5的点观测值的正交多项式. 
a. 证明前三个正交多项式是 

P<,(.t) = \, Pl (t) = t,p 2 (t) = lt 2 -^- 

8 8 

(多项 式巧已 被重新度量，使得它在观测点 
处的值是小整数 .） 


b. 利用二次趋势函数拟合数据（-5,1)，(-3，1), 
(-1,4),(1,4),(3, 6),(5,8). 

在习题5~14中，空间 C[0,2it] 具有 （6) 式的 
内积. 

5. 证明：当时， sinmr 和 sin«r 正交. 

6. 证明： 对所有正整数 m 和 《,sinmr 和 cos«r 正交. 

7. 证明：对 >0，||cosfa|| 2 = Jt，||sin/U|| 2 =Jt. 

8. 求函数 /(r) = r-l 的3阶傅里叶逼近. 

9. 求函数 /(r) = 2jt-f 的3阶傅里叶逼近. 

10. 求方波函数/(0 = | 1 的 3 阶傅里 

[-1 n^t<2n 

叶逼近. 

11. 求 sin ~的3阶傅里叶逼近，不要使用任何积 
分运算. 

12. 求 cos 3 r 的3阶傅里叶逼近，不要使用任何积 
分运算. 

13. 解释为什么两个函数和的傅里叶系数是两个 
函数傅里叶系数之和. 

14. 假若 C[0,2 ti ] 中一些函数/,前面几个傅里叶系 
数是 floAA 和 . 下面哪一个三角多项 
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式更接近/ ?解释你的答案. 
g (r) = -^- + a, cos r + a 2 cos 2/ + <>, sin r 

/i(r) = Y + a, cos t + a 2 cos It + b t sin t + b 2 sin 2t 
15. [ M ] 对 6.6 节习题 13 中的数据，涉及一个飞机 
的起飞表演.假若随着飞机速度的增加，测量的 
误差可能变得更大，且 W 是加权对角矩阵且对 
角线的值是 1, 1 ,1, 0.9, 0.9, 0.8, 0.7, 0.6， 

练习题答案 
1.计算 


0.5, 0.4, 0.3, 0.2 和 0.1, 求一个立方曲线，使 
得拟合数据具有最小的加权最小二乘误差. 
且利用结论估计飞机在 r=4.5 秒的速度. 

16. [M] 对习题 10 中属于空间 C[0,2it] 的方波函 
数，设/ 4 和/ 5 分别表示其 4 阶和 5 阶傅里叶逼 
近.分别画出/ 4 和/ 5 在区间 [0,2it] 上的图形和 
/ 5 在区间 [-2jt,2jt] 上的图形. 


〈屮， 92> = _[_ 2 2 1. 他 =* 叫 =0 

<9 i .?3> = J 2 2 l -(3 r 2 -4) d / = ( r 3 -4 o | =0 


< 92 ,? 3 > = J V (3 r 2 -4 )dr = - 2 r 2 j = 0 


2. / 的 3 阶傅里叶逼近是 C [0,2 n ] 中 / 的最佳逼近，它是由 l , cosf , cos 2 r ， cos 3 r , siru ， sin 2 r 和 sin 3 r 生成子空 
间中的向量函数.显然/属于这个子空间，所以/是自己的最佳逼近. 


/(0 = 3-2sinr + 5sin It- 6cos2f 

对1阶逼近，子空间《"=5口811{1，£：080111}中最接近/的函数是3-28111?， /( r ) 公式中的另外两项与 w 
中的函数正交，所以，它们没有增加傅里叶系数中1阶逼近的积分计算. 

见图 6-42. 



第6章补充习题 


1. 下列命题是针对属于 R " (或 IT ) 的具有标准 a . 每个向量的长度是一个正数. 

内积的向量，确定每个命题的 真假. b. 一个向量 v 与它的负向量 -v 具有同样长度. 
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c . U 和之间的距离是 |u - *>1. 

d . 如果 r 是任意数，那么卜|| = +||. 

e . 如果两个向量正交，则它们线性无关. 

f . 如果 x 与 u 和都正交，那么 x —定与 u - v 正 

交. 

g . 如果 ||u + *f yK + flvl 2 ，那么《和0正交. 

h . 如果 || u-*f =|| U fl 2 +|| vf ，那 么“和 V 正交. 

i . 少在《上的正交投影是一个数和^的乘积. 

j . 如果向量>> 与它在 W 上的正交投影一致，那 
么少属于 

k . IT 中所有正交于一个固定向量的集合是 R " 
的一个子空间. 

l. 如果 W 是 IT 的子空间，那么 IV 和) V 1 没有 
共同的向量. 

m . 如果是一个正交集，且如果 Cl ， C2 ， C3 
是数，那么也是一个正交集. 

n . 如果一个矩阵 t / 具有单位正交列，那么 
UU r = 1 . 

o . —个具有正交列的方阵是一个正交矩阵. 

P . 如果一个方阵具有单位正交列，那它也有单 
位正交行. 

q . 如果 W 是子空间.那么 || pro j wl f + | v - projwl >| 2 

= l*f. 

r . Ac =6 的最小二乘解是 Col A 中最接近 ft 的 
向量 Ai , 即对所有的 x 有 | ft - Ai ||0- Ac |. 

s. Ac =6 最小二乘解对应法方程的解是 
x = {A T AY'A ! b. 

2 . 设 { v , 是一个单位正交集，用归纳法从 
尸= 2 开始验证， 如果 ； c = £：,»>, +... + c p »> p ， 那么 

W 2= h| 2+ ...+W 2 . 

3. 设 { v ,,...,%} 是 W 中单位正交集，验证下列贝 
塞尔不等式，对所有属于] r 的向量的正确性. 

W 2 >|m| 2 +|_r.f 2 | 2 +... + |x.»v| 2 

4. 设 t / 是正交矩阵，证明如果卜,，…，“是 R " 

中的一个单位正交基，那么{叫,...，价„}也是. 


5. 证 明：如 果一个矩阵 t / ，对所有属于] T 的 
向量无和少，满足 （ t / x ).( t /_ v ) = x._v ,那么 t / 是 
一个正交矩阵. 

6. 证明：如果 t / 是一个正交矩阵，那么 t / 的任何 
实特征值一定是 ±1. 

7. —个豪 斯霍尔德矩阵或基本 镜像具有形式 
Q = I -2 uu T ,此处 u 是一个单位向量（见第2 
章补充习题中的习题 13), 证明0是一个正交 
矩阵.（基本镜像经常用于在计算机程序中产 
生矩阵 A 的一个分解.如果 A 具有线性无 
关的列，那么一系列基本镜像的左乘可产生一 
个上三角形矩阵 .） 

8. 设 r : R "— IT 为一保长的线性 变换； 即对 R " 
上所有 X 有 | ru )| = || xfl . 

a . 证明： r 同时保持正 交性； 即只要 x ._ v =0 有 

r(x)roo = o. 

b . 证明： r 的标准矩阵是一正交矩阵. 

9- 设《和是 1 T 中线性无关的非正交的向量，描 
述如何不首先构造 Span { u , v >} 的正交基，可找出 
『中向量 Z 的形如 X,U + X 2 V 的最佳逼近. 

10. 假若 A 的列是线性无关，确定当6用 c * ( c 

是非零标量 > ft 替时， Ax = b 的最小二乘解 i 会 
发生什么变化？ 

11. 如果是不同的数，由于方程的图形是平 
行平面，使得下面的方程组不相容.证明，该 
方程组的所有最小二乘解就是方程 
x -2>> + 5 z = ( a + 6 + c )/3 所确定的平面. 

x~2y + 5z = a 
x-2y + 5z = b 
x-2y + 5z = c 

12. 已知逼近特征向量考虑如何求矩阵 A 
的特征值.由于不是准确向量，方程 

Av = Xv ( 1 ) 

可能没有解.然而，可以通过适当观察 （ 1 ) 
来求得最小二乘解来估计; I . 把看成矩 
阵 V ，把; I 看作 R 1 上的一个向量，并用符号 ft 
表示向量如 . 从而 （ 1 ) 变成 kAV ,同样可 
写成求由含有未知数 a 的这《个方程 
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组成的方程组的最小二乘解，并用原来符号表 
不出来.对 A 的估计结果叫做瑞利商.参照 
5.8 节中习题11和习题 12. 

13. 利用下面步骤证明，下面 mxn 矩阵 A 的四个 
基本子空间之间的联系. 

Row 4 = (Nul A ) 丄 ， Col A = (Nul A 7 ) 1 

a . 证明 Row A 属于空间 (Nul A ) 1 .(证明如果 x 属 
1?(^/1，那么；1：与[^111/1中任意一个《正交.） 

b . 假若 rank A = r ，找出 dim(Nul A ) 和 dim(Nul A ) 夂 
然后从 （ a ) 推出 Row A = (Nul A ) 1 . (提 示： 
研究 6.3 节的练习 .） 

c . 解释为什么 Col/l = ( NulAY . 

14. 解释为什么方程有解的充分必要条件 
是： 6与方程 A T x = 0 的所有解正交. 

习题15和习题16涉及一个 nxn 矩阵形如 

A = 的（实） 舒尔分解， 此处 t / 是一个正交 

矩阵，尺 是- 个 nxn 上三角形矩阵/ 

15. 证明，如果 A 有一个 实舒尔分解 ， A = URU r , 
那么 A 具有 n 个实特征值，计算包含重数. 

16. 假若 A 是具有 n 个实特征根的 nxn 矩阵，包 
含重数， a 记为又，，…，又可以证明 a 有一个 
(实的）舒尔分解， （ a ) 和 （ b ) 两部分给出 
证明的关键思想，证明的其余部分等同于对小 
矩阵连续重复步骤 （a ) 和 （b ), 然后整合到 

-起得到最后结果. 

a . 设 u , 是对应于又 ，的单 位特征向量，，…凡 
是其余向量且{«,，...，叫是 IT 的单位正交基， 
则取 t /=[ u , u 2 …证明 t / Mt / 的第一列 
是此处 e , 是 nxn 单位矩阵的第一列. 

b . ( a ) 部分意味着 t / T At / 具有下列的形式， 
解释为什么4的特征是;^，…，上（提示： 
参考第5章的补充练习 .） 


A J 

[ M ] 当方程的右端有一点变化，例如 


u t au = 


Ax=b + Ab , A * 为向量，方程的解会由 x 改变为 
x + A»r ,此处心满足 AM ) = A *. 商 || A *||/| M 称为 
ft 的相对改变（或称 ft 的相对误差，当 A * 表示 ft 的 
分量可能误差）.解的相对改变是 || A » r ||/| x ||, 当 A 
可逆时， A 的条件数，记为 cond ( A ), 给出一个 x 


相对改变多大 的界： 


在习题17~20中，解出和 A ( Ar ) = A * , 
且证明 （ 2 ) 在每种情形下成立 （ 参考 2.3 节习题 
41-43 中关于病态矩阵的讨论）. 


17. 

18. 


_ 4. 5 3 .!] & = [ 麵 ] [ 酿 ] 
1.6 1.1」 [ 6.843」 

: 4 . 5 3J ],4 0 . 5( X V =「 

1.6 l.i」 |_-°. 003 」 


19. A = 


-5 

10 

19 


-6-4 r 
1 0 -2 

11 7-3 

9 7 1 


" o.iocT 

2.888 

b = 

-1.404 

1.462 


AZ ^ HT 4 


' 0.49' 
-1.28 
5.78 
8.04 



' 7 

-6 

-4 

r 


r 4.230' 


-5 

1 

0 

-2 


-11.043 

20. A = 

10 

11 

7 

-3 

, b = 

49.991 


19 

9 

7 

1 


i 69.536 


^b = 10- 4 \ 


' 0.27' 
7.76 
-3.77 
3.93 


0 如果允许复数，每一 个《><« 矩阵 A 有一个（复数） 
舒尔分解4 = ，此处是上三角矩阵， （T 1 是 

U 的共扼 转置. 这是 A/ 如 rix 如 a/ys/5 1 ( Roger A. Horn 
and Charles R. Johnson, Cambridge: Cambridge 
University Press, 1985, pp. 79 - 100) 中一个非常重要 
的事实. 
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在地球上，经过80分钟稍微多一点.两颗地球资源探测卫星 
静静地沿靠近极地的轨道飞越天空，以185公里宽的幅度，记录地 
形和海岸线的 图像. 每颗卫星在每隔16天会扫遍地球的几乎每一 
平方公里，以致任何地方在8天内可被监测到 • 

地球资源探测卫星所拍到的图像有很多用途，研究人员和城市 
规划人员利用它们研究城市发展速度和方向，工业发展和土地使用 
的变化.在乡村可用于分析土壤湿度，对偏远地区植被进行分类，确 
定内陆的湖泊和河流的位置.政府部门可检测和评估自然灾害的破 
坏程度，如森林火灾、火山熔岩的流动、洪水和飓 风等. 环保部门可 
以确定来自烟囪的污染，测量水力发电站附近的湖泊和河流的温度. 

为了用于研究，卫星上的传感器可同步取得地球上任何地区的 
七种图像，传感器通过不同的波段来记录能量,包括三种可见光谱、 

四种红外光谱.每幅图像都被数字化且存储为矩阵，每一个数表示 
图像上对应点（像素）的信号强度，这七幅图像当中的每一幅都是多波段或多光谱图像的一个波段的影像. 

一个固定区域的七幅地球资源探测卫星图像通常包含大量冗余的信息，原因是一些特性会表现在几 
«图像中.然而其他特性，由于它们的颜色或温度，会反射出只被一个或两个传感器记录的光线.多波段 
图像处理的一个目标是，用一种比研究每幅图像更好的方式来提取信息去观察数据- 

主成分分析是 一种从原始数据中消除冗余信息，因而只需要一幅或两幅合成图像就可以提供大部分 
信息的有效方法.粗略地说，其目的是找出一个特殊的图像线性组合，即给七种像素中每一个賦予权值， 
然后再综合得到一个新的图像值.权值选取的方式使得合成图像中的光线强度的变化幅度或景 象差异 （称为 
第一主成分） 比任何原始图像的都要大.更多成分图像也可用一定的准则来构造， 7.5 节会给出准则的解释. 

主成分分析也可用取自内华达州铁路峡谷的图像 （ 见图 7-1 ) 来解释，地球资源探测卫星三个波段拍 
到的图像是图 a~c. 三个波段的所有信息被重新组合成三个主成分图像，如图 d-f. 第一个成分 d 显示（或 
解释）93.5%的原始数据中的景象差异.用这种方式.三个波段的原始数据被重新组合成一个波段的数据. 
且在某种意义下的景象差异仅损失 6.5%. 

马里兰州的罗克维尔地球卫星公司，友好地提供了显示在这里的图片，他们正在对224种不同波段 
记录的图像进行合成图像的实验.面对如此大量的数据.使用主成分分析，一般可以将数据减少到约15 
个有用的主成分. 





与其他类型的矩阵相比，对称矩阵比其他类型的矩阵更常出现在应用中，其理论完美，本 
质上依赖于第 5 章的对角化技巧和第 6 章的正交性. 7.1 节叙述的对称矩阵对角化，是 7.2 节和 
7 .3节讨论二次型的基础，最后两节讨论的奇异值分解和实例介绍中所描述的图像处理，则需要 
7.3 节的内容.在整章中，所有向量和矩阵的元素均为 实数. 


7.1 对称矩阵的对角化 


一个对称¥阵是一个满足 A T = / l 的矩阵 / I . 这种矩阵当然是方阵，它的主对角线元素是任 
意的，但其他元素在主对角线的两边成对出现. 

例1下面的矩阵中，仅前面三个是对称矩阵. 
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非 对称: 


1-3 
3 0 


"1-4 0' 


*5 4 3 2" 

-6 1 -4 


4 3 2 1 

0-6 1 


3 2 10 


为了开始学习对称矩阵，复习 5.3 节的对角化过程非常有用. 

" 6 -2 _ 

例2如果可能，对角化矩阵 A = -2 6 

-1 -1 

解 A 的特征方程是 

0 = - A 3 +17 A 2 -90 A + 144 = -( A -8)( A -6)( A -3) 
通过标准计算可得到每个特征子空间的一个基 


A = 8 : v , = 

-1 

1 

; A = 6 : v 2 = 

’- 1 

-1 

;A = 3 : v 3 = 

r 

1 


0 


2 


1 


这个向量形成 R 3 的一个基，我们可以用它们作为 P 的列构成矩阵户，其中/^是用于将4对 
角化的.然而，容易看到 { v ,, v 2 ， v 3 } 是一个正交集，且如果它的列是位正交的，会有更多的用途. 
由于用非零数乘以一个特征向量仍然是特征向量，我们可以单位化 v , , v 2 * v 3 得到单位特征向量. 



-1/V2 - 


-l/S 



«i = 

1/V2 

, U 2 = 

-1/V6 

， «3 = 

1/V3 


0 


2/V6 


1/V3 



-1/V2 -1/V6 

l/VT 


'8 0 0" 

P = 

1/V2 -1/V6 

1/V3 

, D = 

0 6 0 


0 2/V6 

1/V3 

J 


0 0 3 


那么有4 = PD /-、 和平常一样.由于/>是方阵且有正交列，所以，户是一个正交矩阵，而就 
是 〆 .（见 6.2 节 .） ■ 

定理1解释了为什么例2中的特征向量是正交的——它们对应不同的特征值. 

定理1 如果4是对称矩阵，那么不同特征空间的任意两个特征向量是正交的. 

证设 v ,* v 2 是对应不同特征值;的特征向量.为证明 》 vv 2 =0, 计算 
Aiv , - v 2 =(A,v,) t v 2 =(Av,) t -v 2 由于 v, 是一个特征向量 

= (v, t A t )v 2 =v, t (Av 2 ) 由于 a t =a 

= vJ ( X 2 v 2 ) 由于*> 2 是一个特征向量 

= A2Vi T v 2 = A2V1 • v 2 

因此（几 1 - Dvi . v 2 = 0，但是几,矣 A2 ，所以 vrv ^ O . _ 

例2中特殊类型的对角化对于对称矩阵理论十分 重要. 一 个矩阵4称为可正交对角化，如 
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果存在一个正交矩阵 P ( 满足= P T ) 和一个对角矩阵£> 使得： 

A = PDP t = PDP，' ( 1 ) 

为了正交对角化一个 nx / i 矩阵，我们必须找到/ I 个线性无关且单位正交的特征向量，什么 
条件下可能做到？如果4是像 （1) 一样可以正交对角化的，那么 
A t = (PDP 1 ) 1 = P Tr D T P T = PDP r = A 

这样 4 是对称的！另一方面，定理2表明每一个对称矩阵都是可正交对角化，结论的证明非常 
困难，这里将其省略，证明的主要思路将在定理3之后给出. 

定理2 —个 / ix/i 矩阵4可正交对角化的充分必要条件是4是对称 矩阵. 


这个定理相当奇妙，我们根据第 5 章的经验可以推测，要知道何时一个矩阵 4 是可对角化 
通常是不可能的，但对称矩阵却例外. 

下面的例子给出一个矩阵，它的特征值并非全部都不相同. 

*3-2 4" 

例 3 将 4= -2 6 2 正交对角化，其特征方程为 

4 2 3_ 

0 = -A 3 +12A 2 -2lA-98 = -(A-7) 2 (A + 2) 

解平常计算可得特征空间 的基： 



V 


"-1/2" 


'-1 ' 

A = 7:v, = 

0 

-lj 

， v 2 = 

1 

0 

， A = -2 ： v 3 = 

1 

-1/2 

1 


尽管 v , 和 v 2 S 线性无关的，但它们并不正交.从 6.2 节可知 v 2 在 v ,上的正交投影是 H . v , ， 

V, Vi 

与 V, 正交的关于 v 2 的分 量是： 


Z2 =v 2 -^Iiv,= 

'-1/2' 

1 

-1/2 

V 

0 

= 

"-1/4 

1 

Vi -V, 

0 

了 



1/4 _ 


于是{ V ,，是关于 ；I = 7 的特征空间的正 交集. （注意 Z 2 是 V ,和 v 2 的线性组合，则 Z2 属于特征子 
空间，构造 Z 2 的过程就是 6.4 节的格拉姆-施密特方法 .） 由于特征子空间是二维的 （基是 Vi ， V2 )， 
正交集合 { v ,, v 2 } 是一个特征子空间的正交基. 

将 v , 和 v 2 规范化，我们得到关于 ;I = 7特征子空间的单位正交基. 



—l/VT 



«i = 

0 

,«2 = 

4 /Vl 8 


1 /V2_ 


1 /Vl 8 


关于;1 = 2对应的特征空间的单位正交基是 
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-2' 


'-2/3' 

-1 

= 

-1/3 

2 


2/3_ 


由定理1，《 3 与其他特征向量《,和《 2 正交，因此{«„« 2 ，《 3 }是一个单位正交基.令 



' l / V 2 

-1/ Vl 8 

-2/3" 


'1 0 o ' 

P = [«l «2 «3]= 

0 

4/ Vl 8 

-1/3 ; 

，D = 

0 7 0 


1/ V 2 

1/ Vl 8 

2/3」 


0 0 -2_ 


那么/»将4正交对角化且4 =户£>/^. 

谱定理 

矩阵4的特征值的集合有时称为 A 的谱，且下面关于4的特征值描述称为谱定理. 


定理 3 (对称矩阵的谱定理） 

一个对称的 nxn 矩阵具有下面特性： 

a. A 有/ I 个实特征值，包含重复的特征值. 

b . 对每一个特征值，对应特征子空间的维数等于; I 作为特征方程的重数. 

c . 特征空间相互正交，这种正交性是在特征向量对应不同特征值的意义下成立的. 

d . 4可正交对角化. 


(a ) 可从 5.5 节的习题24得出 ， （b ) 可从 （d ) 容易得到 （ 见练习31 ) . ( c ) 就是定理 1. 
由于 （a )， （ d ) 的一个证明可用习题32和第6章补充习题14已经讨论过的舒尔因子分解给出， 
证明的细节从略. 


谱分解 



0 " 

m, t 

0 




假设4 = PD /- 1 ，此处/>的列是4的单位正交特征向量 Ul ，…，《„，且相应的特征值;^，…，七属 
于对角矩阵£>，那么广'=，. 


A = PDP t =[«,•••«„] 


利用乘积的行列展开，我们可以得到 

A = XiUxU, 1 + A2« 2 M2 T + …+ 


由于它将4分解为4的谱 （ 特征值）确定的小块，这个 A 的表示就称为4的谱分解， （ 2 ) 
中的每一项都是一个秩为1的 nxn 矩阵.例如， A UlU , T 的每一列都是〜的倍数.更进一步，在 I 
属于 IT 的意义下，矩阵《;«/是投影矩阵，向量 ( U ; U /) jc 是 jc 在由〜生成子空间上的正交投影. 


( 见习题 35.) 
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例4构造矩阵4的一个谱分解，已知4有以下正交对角化分解. 


解 


A = 



2/ V 5 -1/ V ^「8 Ol |" 2/ V 5 1 /VT 
.1/ V 5 2/ V ^」 l _0 3 j |__ i /v ^ 2/ V 5_ 


将 P 的列记为 u , 和 u 2 , 则有 


为验证 4 的谱分解，计算 


A = %u x u^ +3m 2 «2 T 


且 


« 2«2 


:；3-叫；切 
:―;:3-^ 2/ 辱 — 切 


8«!«! 7 + 3 « 2 « 2 T 


'32/5 16/5] 「3/5 -6/5 l ["7 2 
.16/5 8/5」 + [_-6/5 12/5」 = [2 4_ 


数值计算的注解 当4是对称且不太大的矩阵时，现代高性能的计算机程序可以非常 
精确地计算特征值和特征向量，它们对4使用一系列包含正交矩阵的相似变换，变换 
后矩阵的对角元素很快收敛于4的特征值 .（见 5.2 节的数值计算注释 . ） 利用正交矩阵 
常常可避免计算过程的误差积累，当4对称时，正交矩阵序列可形成列向量是4的特 
征向量的正交矩阵. 


一个非对称矩阵没有完全的正交特征向量集，但通过算法仍得到相当精确的特征 
值，之后，就需要用非正交化方法计算特征 向量. 


练习题 


1. 证明如果4是对称矩阵，那么4 2 也是对称的. 

2. 证明如果4是可正交对角化的，那么也是可正交对角化的. 

习题 7.1 


判断习题1~6中哪 -- 个矩阵是对角矩阵. 



二6 

2 

0" 


[12 

1 2" 

0 

-6 

2 

6. 

2 1 

2 1 

0 

0 

一 6 」 


1 

_1 2 

12 


判断习题7~12中哪一个矩阵是正交的，如果 
正交，求出它的逆矩阵. 


0.6 0.8' 1/V2 -1/V2' 

- 0 - 8 ^ 0 . 6 」 '1/V2 1/V2 



"2/3 2/3 1/3 

11. 0 1/ V 5 -2/ V 5 

V 5/3 -4/ V 45 -2/ V 45 
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0.5 0.5 -0.5 -0.51 
-0.5 0.5 -0.5 0.5 

0.5 0.5 0.5 0.5 

-0.5 0.5 0.5 -0.5_ 

将习题 13-22 中的矩阵正交对角化，并给出一 
个正交矩阵 P 和一个对角矩阵 O ,为节约时间， 
给出习题17~24的特征值是： （17) 5,2, —2; ( 18) 
25, 3, -50, ( 19 ) 7， -2; (20) 13, 7，1, ( 21 ) 
9, 5, 1 ; ( 22 ) 2, 0. 

..T3 11 


14. 


16 -4 
-4 1 


-2 4 


-2 6 2 

4 2 3 

4 13 1. 

14 13 
3 14 1 


-7 241 
24 7」 

■ -2 -36 

-36 -23 

0 0 
.7-4 4" 

-4 5 0 

4 0 9 

2 0 0 0 


23. 设4 = 

'3 1 r 

1 3 1 

和”= 

1 


1 1 3 


0 


0 0 2 0 
0 10 1 


证明5是4的一 


个特征值且 v 是一个特征向量，然后将4正交 
对角化. 



" 5 -4 -2 


"-2" 


V 

24. 设4 = 

-4 5 2 
-2 2 2_ 

， V ,=| 

2 

1 

和 v 2 = 

1 

0 


验证的特征向量，然后将4正交 
对角化. 

对习题25~26,判断每一个命题的真假，验证 
你的答案. 

25. a . 可正交对角化的矩阵4 一定是对称的. 
b . 如果且向量 a 和 v 满足 4 a = 3 a 和 
Av -4 v ,那么 a . v = 0 . 


c . 一个 nxn 对称矩阵4有 "个不 同实特征值. 

d . 对属于 R " 的非零向量 V ,矩阵 vv T 被称为投影 
矩阵. 

26. a . 每一个对称矩阵4都是可正交对角化的. 
b . 如果3 =尸/3尸 7 ，此处，=尸 _1 且是对角矩 

阵，那么 fl 是对称矩阵. 

c . 一个正交矩阵是可正交对角化的. 

d . —个对称矩阵的特征空间的维数等于对应特 
征值的重数. 

27. 若 A 是对称矩阵， fl 是任意 uxm 矩阵，证明 
B X AB ， S T fl 和是对称矩阵. 

28. 证明，如果4是一个 nxn 对称矩阵，那么对任 
意属于 R " 的 x ，_ y 有 （ Ac)._y = x .( Ay ) 成立. 

29. 若4可逆且可正交对角化，解释为什么 / T 1 也 
是可正交对角化的. 

30. 若4和 fl 都可正交对角化且 = 解释为 
什么也是可正交对角化的. 

31. 若4 =尸/3尸 — \其中尸是正交矩阵， D 是对角 
矩阵，且又是4的重数为 / t 的特征值，那么又 
在对角矩阵 O 中出现 / t 次，解释为什么又的特 
征空间的维数是 

32. 若4 =尸/?厂、其中尸是正交的且/?是上三角 
形矩阵，证明，如果4对称，那么是对称的， 
因而实际上是一个对角矩阵. 

33. 构造例2中矩阵4的一个谱分解. 

34. 构造例3中矩阵4的一个谱分解. 

35. 若《是《"中的单位向量，取 = 

a . 对任意属于 r 的 X ，计算&且证明是 x 
在《上的正交投影，正如 6.2 节所描述的情况. 

b . 证明 fl 是对称矩阵且 

c . 证明《是3的特征向量，并求其对应的特征 
值. 

36. 设 fl 是 nxn 对称矩阵且 fl 2 = fl ，任何此类矩 
阵被称为投影矩阵（或一个正交投影矩阵）. 
对任意给 定的） eir , 取夕=办且 z =) -夕. 
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a . 证明 z 与正交. 

b . 设 W 是 fl 的列空间，证明/是沐空间中 
一个向量与空间《^中一个向量之和.证 
明办是 _ V 在 fl 的列空间上的正交投影. 

[ M ] 正交对角化习题37~40中的矩阵，为练习 
本节的方法，不要用矩阵程序中特征向量的常规解 
法，而是使用程序求出特征值，然后对每个特征值 
求出 Nul ( A - Xl ) 的单位正交基，即类似例2和例3 
中的做法. 

「5 2 9 -61 


-6 9 2 5 


" 0.38 -0.18 -0.06 -0.04' 
-0.18 0.59 -0.04 0.12 

-0.06 -0.04 0.47 -0.12 

-0.04 0.12 -0.12 0.41」 

[0.31 0.58 0.08 0.44' 

0.58 -0.56 0.44 -0.58 

0.08 0.44 0.19 -0.08 

0.44 -0.58 -0.08 0.31 


40. 


10 2 2 -6 9 ' 

2 10 2-6 9 

2 2 10 -6 9 

-6 -6 -6 26 9 

9 9 9 9 -19 


练习题答案 

1. 由转置矩阵的性质得到 （4 2 ) t = ( A 4) t = 4 t 4 t ， 由假设， 4 t =4 ( 所以 （4 2 ) t =>U = 4 2 , 从而证明了 
是对称的. 

2. 如果4可正交对角化，那么由定理2可知矩阵4对称，由练习题1，对称且可正交对角化（定理 2). 


7.2 二次型 


到目前为止，本教材除了第6章计算时所遇到的平方和外，我们所关注的主要是线性 
方程，这类平方和及更一般形式的表达式称为二次型，它常常出现在线性代数在工程 （标 准设 
计和优化）和信号处理（输出的噪声功率）的应用中.它们也常常出现在物理学（例如势能和 
动能）、微分几何 （ 例如曲面的法曲率）、经济学 （ 例如效用 函数） 和统计学 （ 例如置信椭 圆体） 
中，某些这类应用实例的数学背景很容易转化为对对称矩阵的研究. 

、 ® "上的一个 二次型 是一个定义在 IT 上的函数，它在向量 jc 处的值可由表达式 2 (jc ) = jc t 处 
计算，此处4是一个 nxn 对称矩阵，且矩阵4称为 关于二次型的矩阵. 

最简单的非零二次型是 2( x ) = x t / x = || x | 2 ，例 i 和例2说明了对称矩阵 A 和二次型之 
间的关系. 


例1令&，计算下列矩阵的/如. 

^2 



解 


a . 


x T Ar = [^, x 2 ] 



= [x x X2~\ 


4^, 

3^2 


-Ax x 2 +2 >x 2 2 . 
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b. 在 A 中有两个值为 -2 的元素，注意观察矩阵 A 中 （ 1,2 ) 元素如何出现在计算中’用粗 


体字给出. 


x r Ax = [ x , x 2 ] 


■3 

-2 



「3^:, - 2 x 2 


= X\ (3 a :, — 2x 2 ) + X2 ( — 2 a：i + 1 x 2 ) 

= 3 x , 2 - 2 x l x 2 - 2 x 2 x l + 7 x 2 2 

= 3^, 2 -4x t x 2 + lx 2 2 _ 

例 1 ( b ) 中二次型中出现了项，是因为矩阵 4 对角线上出现了元素 -2, 相反，例1 


U ) 中涉及的对角矩阵的二次型中没有的交叉乘 积项. 

例 2 对属于 R 3 的 X ，取(20) = 5々 2 +3；(： 2 2 +2而 2 -¥ 2 +8^ 2 而，写出 x t Ajc 形式的二次型. 
解 <,; c 2 2 ，; c 3 2 的系数仍在对角线上，为使4对称，当时， H 的系数必须平均分配给 
矩阵4中的(/，>)元素和 CM ) 元素. 的系数0,很容易验证 



5 

-1/2 

0" 

■V 

Q ( x ) = x r Ax = [ x l x 2 ^ 3 ] 

-1/2 

3 

4 

x 2 


0 

4 

2 

_ x K 


例3 


r_3"| r 21 

令2(幻= 4 2 -8;^2-5;^，计算2(幻在1=, ，，和 

L 1 」 



处的值. 


解 

G (-3, 1) = (-3) 2 -8(—3)(1) — 5(1) 2 =28 
G (2，— 2) = (2) 2 -8(2)(— 2) — 5(-2) 2 =16 

2(1， —3) = ( I ) 2 — 8(1)(-3) — 5(— 3) 2 = — 20 ■ 

在某些情况下，没有交叉项的二次型会显得更容易使用，也就是二次型对应的矩阵是对角 
矩阵.幸运的是，交叉项可以通过用适当的变量代换来消去. 


二次型的变 置代换 


如果 jc 表示 IT 中的向量变量，那么变置代换是下面形式的 等式： 

x = Py y = P~'x ( 1 ) 

此处/ 1 是可逆矩阵且 j 是 IT 中的一个新变量，这里 P 的列可确定 K " 的一个基， J 是相对于该 
基向量 jc 的坐标向量.（见 4.4 节 .） 

如果用变量代换处理二次型，那么 

x J Ax = ( Py ) J A ( Py ) = y T P T APy = y T ( P T AP)y (2) 

且新的二次型矩阵是 PM 尸， 如果 尸可将 4正交对角化， 那么 〆 =广，且/^/^/- 1 /!/^/)， 


例4求一个变量代换将例3中的二次型变为一个没有交叉项的二次型. 


解例3中二次型对应的矩阵是 
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A = \ 


-5 


第一步是将矩阵4正交对角化， A 的特征值是 A = 3 和又=-7,相应的单位特征向 量是： 
A = 3: 


- nS 

2 _ n • 

MS 


A — —/ . 

2/ S _ 


这些特征向量自动正交 （ 因为它们属于不同的特征值）且构成 K 2 的一个单位正交基•取 

p = [ 2/W 叫 

[- 1/>/5 2/yf5] 

那么 / IsPDP 1 , 且 D = P ^1/> = P t > V />， 像前面指出的那样，一个适当的变换是 


Py , 此处. 


:]， ° = [: 
磨出的那样 


那么 


jt ? -5 jc ! = x r Ax 

= (Py) r A(Py) 

= y T P T APy = y T Dy 

= 3y^-7yl ■ 

为了说明例 4 中二次型相等的意义，我们可以利用新二次型计算 GOO 在 * = (2, -2) 处的值， 
首先，由于* = />，我们得到 

y = p' X = p^ X 

则有 

，彳 2/ 5 -叫 [ 2 "| =[叫 

[l/yf5 2lS L-2J -2 />/5 


因此 


3^-7^ =3(6 / >/5) s -7(-2 />/5) 2 =3(36/5)-7(4/5) 
= 80/5 = 16 

这就是例3中 G ⑷在：=(2«-2)处的值，见图 7-2. 



图 7-2 * T At 中的变量代换 


例4说明了以下定理，定理的证明在例4之前已基本上给出. 
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定理4 (主轴定理） 

设 A 是一个 《xn 对称矩阵，那么存在一个正交变量变换 x = 0 ，它将二次型 x T Ac 变换为 
不含交叉项的二次型 y T Dy . 

定理中矩阵 P 的列称为二次型 x T Ac 的主轴，向量 j 是向量 x 在由这些主轴构造的 R " 空间 
的单位正交基下的坐标向量. 

主轴的几何意义 

若 0( x ) = x t Ac ， 此处4是一个 2 x 2 可逆对称矩阵， c 是一个常数，可以证明 R 2 中所有满 
足 

x t Ac = c (3) 

的的集合，对应一个楠圆（或者圆）、双曲线、两条相交直线或单个点，或根本不含任意点. 
如果4是一个对角矩阵，如图 7-3 所示， （3) 的图像 是标准位置. 如果 A 不是一个对角矩阵， 
如图 7-4 所示， （ 3 ) 的图形是标准位置的旋转.找 到主轴 （由 A 的特征向量确定）等同于找到 
一个新的坐标系统，在该坐标系统下其图形是在标准位置下的图形. 

图 7-4 b 中的双曲线是方程 x T Ac = 16的图形表示，其中 A 是例4中的矩阵，图 7-4 b 中 y , 轴 
的正向是例4中矩阵 P 第一列的方向，化轴的正向是矩阵 P 第二列的方向. 



椭圆 



双曲线 


图 7-3 标准位置上的椭圆和双曲线 






图 7-4 不在标准位置的椭圆和双曲线 








404 


第 7 幸 


例5图 7-4 a 中.楠圆的方程为5為 2 -如山+54 =48，求一个变量代换，将方程中的交叉 
项消去. 

解二次型对应的矩阵为4 = ~^1, A 的特征值是3和7,对应的单位特征向量为 



%P = [ Ul u 2 ] = \ l，yf l _1/ "?1,那么尸可将 A 正交对角化.所以变量代换义=/^得到的二次 
[l/yf2 l/yf2] 

型为，勿= 3义 2 + 7;^，变量代换的新坐标轴如图 7-4 a 所示. ■ 

二次型的分类 

当 A 是一个 nxn 矩阵时，二次型 G (*) = * T Ar 是一个定义域为 1 R " 的实值函数，对二次型 
GOO 定义域中的每一个点对应 * = (4,4) ，可画出点 ( jci , jc 2 ， z ) ，其中 z = G (*). 注意，除了* = 0 
外，图 7-5a 中所有 GU) 的值都是正数，图 7-5d 中所有 GW 的值都是负值，图 7-5a 和图 7-5d 
中图形的水平截面是椭圆，而图 7-5c 的水平截面对应双曲线. 



图 7-5 二次型对应的图形 
图 7-5 中简单的 2 X 2 例子说明下列定义. 

定义 一个二次型 （3 是： 

a. 正定的， 如果对所有 jc*0 ， 有 GU)>0. 

b . 负定的， 如果对所有 jc *0， 有 (2( x )<0. 

c. 不定的， 如果 G(J«0 既有正值又有负值 • 

此外， G 被称为半正定的，如果对所有 jc ， Q(x)^0 ; (2 被称为半负定的，如果对所有 X ， 
G ( jc )<0. 图 7-5 中 a 和 b 的二次型都是半正定的. 

定理5根据特征值为二次型分类.见图 7-6. 

定理5 (二次型与特征值） 

设 A 是 nxn 对称矩阵，那么一个二次 型是： 
a •正定的，当且仅当 4 的所有特征值是正数. 
b . 负定的，当且仅当 >4的所有特征值是负数. 
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3. 求二次型的矩阵，假设 x 属于 R 2 . 
a. lOjcf - 6jciJc 2 - 3 jc | b . 5 jc ? + 3 xiJc 2 

4. 求二次型的矩阵，假设 x 属于 R 2 . 
a. 20 jc? +15^ 2 -IOjtI b. x Y x 2 

5. 求二次型的矩阵，假设 X 属于 R 3 4 5 6 . 

a. %X\ + Ixi —3jf| — 6义 | 义2 + — 

b . 4 xi ^2 + 6x1X3 — 名 X2X3 

6. 求二次型的矩阵，假设 jc 属于 R 3 . 

a. 5 jci 2 -j^+lxl+ 5x t x 2 - 3 ^,^ 3 

b . xi -4 x , X 2+4 x 2 X 3 


c . 不定的，当且仅当 A 既有正特征值，又有负特 征值. 

证由主轴定理，存在一个正交变换 jc = ^y ,使得 

Q ( x ) = x T Ax = y T Dy = hyx + X^yl + …■: y „ 2 ( 4 ) 

此处々，^，…，々是 A 的特征值，由于/>是可逆的，非零向量 JC 和非 
零向量; V 之间存在一个一一映射.这样，时， G ( jc ) 的值与 （4) 
右边表达式的值完全对应.显然，像定理所描述的三类方式一样，它 
由特征值;•，又 ，的 符号所 确定. ■ 

例6 G ( x ) = 3 x , 2 + 2 x 1 + X , + 4 xtx 2 + 4 x 2 x 3 是正定的吗？ 

解 由于所有项的系数是正数，二次型表面上看是正定的.但 
二次型对应的矩阵为 




且 A 的特征值是5, 2和 -1, 所以 GOO 是不定二次型，而不是正定 
二 次型. ■ 

利用二次型的分类，相应地得到矩阵的形式分类.一个正定矩阵 
A 是一个对称矩阵，则二次型 jc t A c 是正定的.其他形式的矩阵（如 
半正定矩阵）的概念可类似定义. 


数值计算的注解 确定对称矩阵4是正定的最快捷的方式，是尝试将矩阵 A 分解为 
A = /? T /? ，此处/?是具有正对角线元素的上三角阵 （ 可以采用一个略微修改的 Lt / 分解 
算法）.这样的乔累斯基分解算法可行充分必要条件是 A 是正定的.见补充练习 7. 


根据矩阵 A 的特征值，给出一个半正定矩阵. 
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7. 求一个变量代换 ， x = Py ,将二次型 

变换为没有交叉项的形式，给出 
P 和新的二次型. 

8. 设 A 是下列二次型的 矩阵： 

9jcf + 7 jc2 +11^3 — SX1X2 + 8^1^3 
可以证明 A 的特征是3,9和15,求正交矩阵 P ， 
使得变量代换 x = 0 将变换为没有交叉 
项的形式，给出 P 和新的二次型. 

给出习题9~18的二次型分类，然后求一个变 
量代换 x = 将二次型变换成没有交叉项的形 

式，写出新的二次型. 

9. 3 x , 2 -4 x , a : 2 +6 x 2 2 10. 9^, 2 -8^ 2 +3^2 

11. 2 x 1 +10^^ 2 + 2 x ] 12. -5 x , 2 + 4 x , x 2 - 2 x 1 

13. xi - 6 x t x 2 +9 xl 14. 8 x , 2 + 6 x , x 2 

15. [ M ]-2 x , 2 -6 xl - 9 xl -9 xl + 4叫 2 + 4 x t x ，+ 4 x t x t + 

6 xiXi 

16. [ M ] 44 2 + 4; c 2 2 + 4; c 3 2 + 4; c 4 2 + 3 x t x 7 + 3 x 3 x t - Ax x x t + 

4灿 

17. [ M ] Xx + x \ + x , +xj +9 x , x 2 - 12 x , x 4 +\2 x 1 x i + 
9 x 3 x 4 

18. [ M ] 1 ljt ) 2 — X2 — 12^1^2 — 12^[^3 — 12^1^4 — Ix ^ x ^ 

19. 如果 x = (, x t , x 2 ) fO x T x = l ，即 x , 2 + 4=1，二次 
型 5 x , 2 +8 x 2 2 的最大值是什么？（用; c 的一些例 
子试试 .） 

20. 如果 x T x = l , 二次型5乂 -34 的最大值是什 
么？ 

习题21~22中，矩阵是方阵且向量属于 
R ". 判断每个命题的真假，验证你的结论. 

21. a . 二次型的矩阵是一个对称矩阵. 

b . 一个二次型没有交叉项的充分必要条件是 
二次型对应的矩阵是对角矩阵. 

c . 二次型 x T A «: 的主轴是 A 的特征向量. 

d . 一个正定二次型2满足，对所有 
xeR "，2( x )>0. 

e . 如果一个对称矩阵 A 的所有特征值是正 
的，那么二次型 x T At 是正定的. 


f . 一个对称矩阵 A 的乔累斯基分解具有形式 
a = r t r , 其中上三角矩阵具对角线元素 
为正数. 

22. a . 表达式 || xf 是一个二次型. 

b . 如果 A 对称且 P 是正交矩阵，那么变量代 
换 ； c =巧将 x T Ac 变为没有交叉项的二次 

型. 

c . 如果 A 是一个 2 x 2 对称矩阵，那么满足 
x T /4 x = c (£ •是常数）的; c 的集合对应的 
几何图形是圆，或椭圆或双曲线. 

d . 一个不定二次型，或者是半正定形式或者 
是半负定形式. 

e . 如果 A 对称且对 x #0, 二次形 x T At 仅仅 
有负值，那么 A 的所有特征值是负的. 

习题23~24表明，当 A = =]， detA *0 时， 

不用求出 A 的特征值就可将二次型 2( x ) = 分类. 

23. 如果人和心是八的特征值，那么 A 的特征多 
项式可以用两种方式 写出： det ( A - A /) 和 

,利用这个结论 说明； l , +1 = 
a + d ( 是 A 的对角线上的元素），且入1 = 
det A . 

24. 验证下列 命题： 

a . 如果 detA >0 且 a >0 ，则2是正定的. 

b . 如果 detA >0 且 a <0 ，则2是负定的. 

c . 如果 detA <0， 则2是不定的. 

25. 证明： 如果 S 是 mxn 矩阵，那么 S T S 是半正 
定的； 如果 S 是 nx « 可逆矩阵，那么 S T S 是 
正定的. 

26. 证明： 如果矩阵 A 是正定的，那么存在一 
个正定矩阵 S , 使得 A = S T S .( 提示： 写出 
八=户/^ 7 且户 7 =户' 构造一个对角矩阵 C , 
使得 Z ) = C T C ，且令 fl = PCP T ,说明 fl 满足条 
件 .） 

27. 令 A 和 S 是 uxu 对称矩阵且所有特征值都为 
正，证明 A + S 的特征值也是正的.（提 示：考 
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虑二次型 .） jc t At 是正定的，那么二次型也是正定 

28.令 A 是 /2 X /2 可逆对称矩阵，证明，如果二次型 的 .（ 提示： 考虑特征值 ■) 

练习 题答案 

构造一个正交变量代换 Jr = 行.并且像 （4) 式一样 写出： 

jc t At = y T Dy = ?\iyi + + …+ 尤/ 

如果一个特征值（例如人）是负数，那么对应于 j = 的 （/„ 的第 i 列）的 * 取值使得: r T Ar 是负数，所以， 
一个半正定的二次型的所有特征值一定 非负.反之， 如果所有特征值非负，上面的展开式说明， At —定 
是半正定的.见图 7-7. 



图 7-7 半正定 

7.3 条件优化 

工程师、经济学家、科学家和数学家常常要寻找在一些特定集合内的 X 值,使得二次型 Q ( x ) 
取最大值或最小值.具有代表性的是，这类问题可化为*是在一组单位向量中的变量的优化问 
题.下面我们将看到，这 类条件优化问 题有一个有趣且精彩的解，例6及后面的 7.5 节将讨论 
如何从实际引出这类问题. 

K " 中的一个单位向量 JC 可用以下几种等价形式来 描述： 

«xB=i ， W J =1,^=1 

和 

X\ +X2 + ••• + JT* = 1 ( 1 ) 

我们将用,但在应用中经常使用展开式 （ 1 ). 

当一个二次型没有交叉项时，可以很容易得到在 Jc T jr = l 的条件下， Q ( x ) 的最大值和最小值. 
例1求 Q ( x )= 9 x , 2 + Axl +3*|,在限制条件=1下的最大值和最小值 • 

解 由于 jc | 和是非负的，注意到 

4 jc 2 2 $9 jc ! 和 3 x 1 ^ 9 x 1 

所以当 JC ? 十4+4=1时， 

Q ( x ) = 9 xt + 4 xl +3 x | 

$9 x , 2 +9 x |+9 jc | 

= 9 ( xf + xl + xi ) 

= 9 
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因此当 jc 为单位向量时， G (*) 的最大值不超过 9. 更进一步，当 jc = (1. 0,0)， G ⑷ = 9. 从而9 
是 Q ( x ) 在= 1条件下的最大值. 

为求出 GU ) 的最小值，注意到 

9<冰 ， 

因此当4+4 +為 2 =1时， 

Q ( x ) ^ 3 x ^+ 3 xl +3 x | = 3( x , 2 + x ! 十; c 《） = 3 

当 A =0, x 2 =0, x 3 =1时. Q(x) = 3 . 从而 3 是 g ( jc ) 在 jc t jc = 1 条件下的最小值. _ 

从例1可以看到，二次型的矩阵具有特征值9, 4和3,且最大和最小特征值分别等于在限 
制条件下的 GU ) 的最大值和最小值.我们将会看到，此结论对任何二次型也是成立的. 

例2 令 焱=|^ Yj , 汽 * 属于 1 R 2 时， Q(X) = x r Ax , 图 7-8 是 G 的图形表示，图 7-9 表示圆 

柱体内部的一部分，圆柱与曲面的截面是点集表示在 xf + jcfd 情况下的 z = G ( x ,， x 2 ). 
这些点的高度值是 G (*) 的约束值，从几何意义上看，条件优化问题确定的是截面曲线上最髙点 
和最低点的位置. 

曲线上的两个最髙点在為々平面之上7个单位，出现在点為=0和 X 2=± l 处，这些点对应 A 
的特征值7和特征向量 * = (0,1) 和 -* = (0,-1). 类似地， 曲 线上的两个最低点在 jc 山平面之上3 
个单位，它们对应特征值3和特征向量 (1, 0) 和 (-10). 



图 7-8 2 = 3 x , 2 +7 x | 



图 7-9 2 = 3/ + 7々 2 和圆柱4+4=1的交线_ 


图 7-9 中交线上的每一点对应的 Z 坐标在3和7之间.且对任何3和7之间的数 r ,存在一 
个单位向量 a ： 使得 GOc ) = r , 换言之，所有 jr T Ac 的可能值在 || jc || = 1 条件下的集合是闭区间 
3《 r 《7. 

可以证明，对任何对称矩阵>1，在 H = 1 条件下， jcMjc 所有可能值的集合是实轴上的闭区 
间 （ 见习题 3 ) • 分别用 w 和 M 表示区间的左端点和右端点，即取 

m = min { x T Ac : ||*|| = 1} , M = max {* T Ac :|| x || = l} ( 2 ) 

习题 12 要求你证明，如果； I 是 A 的一个特征值，那么正像例2—样，下面的定理 
说明 m 和 M 自身也是 A 的特征值 . e 


© (2) 式中的 min 和以及定理6中的最小和最大.是指实数的自然顺序而不是指量级的最小和最大. 
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定理6设 A 是对称矩阵，且 w 和 M 的定义如 （2) 式所示，那么 M 是 A 的最大特征值不， 
w 是 A 的最小特征值，如果 x 是对应 M 的单位特征向量《,，那么 x t Ajc 的值等于 M ， 如果 x 是 
对应 w 的单位特征向量， x T Ax 的值等于 m . 

证 A 的正交对角化是/>£)/>_、我们知道 

当文=坩时， x T Ax = y T Dy (3) 

同样 


对所有: y，W = ||^ y || = b || 

因为 P T P = /, 且 ||0|| 2 . 特别地， ||3>| = 1 充分必要条件是 ||x| = l ， 

这样，如果 x 和 j 是任意单位向量， x t Ajc 和: y T Z ^ 可以认为是具有同样值的集合. 

为简化记号，我们假设 A 是以 a 彡彡 c 为特征值的 3 x 3 矩阵，重排 P 的列（特征向量），使 
得/ * = [«, m 2 m 3 ] 和 

0 0 " 

0 0 
0 0 c 

对给定 R 3 中的单位向量: y ， 其坐标为注意到 
ayx = ay , 2 
byl < ayl 


将不等式相加，我们有 


y T Dy = ay ^+ by 2 2 +cyi 


= a(y^ + yl+y^：) 

=a \\yf =a 

这样由 M 的定义可知. M ^ a , 然而，当: y = ei =( l ，0,0 M ^, y J Dy = a . 所以，事实上 M : 
且由 （3) 可知，对应于 3 >= ei 的向量 x 是矩阵 A 的特征向量 Kl ， 其原因是 


Pe x =[«, « 2 « 3 ] 


这样从而证明了关于 M 的论断.同理可证明 m 是最小特征值即 c 值，且 
xMjc 的这个值当 x = Pe 3 = H 3 时可以取到. ■ 

"3 2 

2 3 1 | ,求二次型:^如在限制条件 x T x = l 下的最大值，且求一个可以取到 


例3令/1 = 


该最大值的单位向量. 

解由定理6,我们只需求出 A 的最大特征值，其特征多项 式是： 
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0 = _ A 3 + 10 A 2 — 27 A +18 = —(A _ 6)( A - 3)( A -1) 

最大特征值为 6. 

限制条件下 xVU 的最大值，可以在特征值 A = 6 对应的单位特征向量 x 处获得，解 ( A -6/) 


= 0,我们可得特征向量 

r 

1 

和的= 

1/ V 3 

1/ V 3 




1/ V 3 


在稍后的应用实例中，我们要考虑的值，这里 x 不仅是单位向量，而且是与定理6 
提到的特征向量《,正交的向量，这种情形有如下面的定理. 

定理 7 设耒人和^如定理 6 所示.在如下条件限制下 
x T x = l , x T «, =0 

x t Ajc 的最大值是第二大特征值; U , 且这个最大值，可以在 X 是对应； U 的特征向量处达到. 

定理7的证明和上面讨论的类似，即定理化为二次型的矩阵是对角矩阵的情形，下面的例 
子给出对角矩阵情形下证明的思路. 

例 4求知, 2 +如 2 2 +3々 2 的最大值，其限制条件是 x T x = l 和 x T Kl =0 ,这里 Kl =(1,0,0). 注意到 
私是二次型对应的矩阵的最大特征值;1 = 9对应的单位特征向量. 

解如果 x 的坐标为 u 2 ， a ， 那么限制 x T «, =0简单意味着 4 = 0 ,对这样的一个单位向 
量， g +4= l 且 

9 jc , 2 + 4 x 1 + 3 x 1 = Ax \ + 3^3 
< 4x 2 2 + Ax] 

= ^ x 2 1+ xl ) 

= 4 

在这样的限制条件下，二次型的最大值不超过4,且这个最大值可在 x = (0， l ，0) 处达到，而这就 
是二次型对应矩阵的第二大特征值对应的特征向量. ■ 

例 5令 A 表示例3中的矩阵，且“,是对应矩阵 A 最大特征值的特征向量，求 x t Ajc 的最 
大值，其限制条件是 

X J X = \, x T «, =0 (4) 

解由例3可知， A 的第二大特征值是;1 = 3,解方程 ( A -3/) x =0 求出;1 = 3对应的特征向 
量，且单位化得到 


«2 = 


" I/S' 
1/V6 
- 2/^6 


由于特征向量对应不同的特征值，向量《 2 和《,自然互相垂直.这样，在条件 （4) 的限制下， x t Ajc 
的最大值是3,且在 x = h 2 处可以达到. ■ 

下面的定理是定理7的推广，它和定理6—起给出矩阵 A 所有特征值的有用特性.具体证 
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明从略. 

定理 8 设 A 是一个 nx« 对称矩阵，且其正交对角化为 A = /V)P -1 , 将对角矩阵£>上的元 
素重新排列，使得 九彡; U 彡… 彡尤，且/»的列是其对应的单位特征向量《,，•••,《<■•那么对 
灸= 2,…, n 时，在以下限制条件下 

x T x = 1, x T «i = 0,…=0 
的最大值是特征值； U , 且这个最大值在 x =« t 处可以达到. 

定理8在 7.4 节和 7.5 节非常有用，下面的应用仅仅需要定理 6. 

例 6 在下一年度，一个县政府计划修 jc 百英里的公路和桥梁，并且修整 y 百英亩的公园和 
娱乐场所，政府部门必须确定在两个项目上如何分配它的资源（资金、设备和劳动等等），如果 
更划算的话，可以同时开始两个项目，而不是仅开始一个项目，那么 x 和^必须满足下 面限制 


条件 


4at j +9/06 

见图 7-10, 每个阴影 可行集 中的点 ( jc , 30,表示一个可能的该年度公 
共工作计划.在限制曲线4/+9 〆 = 36上的点，使资源利用达到最大 


可能. 


公园和 
娱乐场所 
2 



公路和桥梁 


图 7-10 公共工作计划 


为选择它的公共计划，县政府霱要考虑居民的意见，为度量居民 
分配各类工作计划的值或效用，经济学家有时利用下面的函数 
q(x,y) = xy 



其中使为常数的 ( jtj ) 点的集合，称为 无差别曲线， 从图 7-11 中可以看到三条这样的曲 


线，沿着无差别曲线的点对应的选择，表示居民作为一个群体有相同的价值观 e . 求公共工作 
计划，使得效用函数 g 最大. 

解 限制条件的方程4?+9/=36并没有描述一个单位向量集，但变量代换可以修正这个 
问题，重写限制条件如下 形式： 



且定义 


㊀ 关于无差别曲线的 讨论， 可参考 Michael D. Intriligator, Ronald G.Bodkin, and Cheng Hsiao, Econometric Models, 
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从而限制条件 变成: 


4 = 吾，4=|，即 Jc = 3 jc】，y = 2 jc 2 


JC ] 2 + JC2 = 1 

效用函数变成取 JC = |^J, 那么原问题变为，在限制条件 JC T JC = 1 
下 (2( jc ) = 6 jc , jc 2 的最大值，注意到 (2( jc ) = jc t >U: 且 
A = 

A 的特征值是士3,对应4 = 3的特征向量是|^^^|，对应 A = -3 的特征向量是 lUgj， 这样 

2(工)=#'，4)的最大值是3,且在 jc , =1/7^和心 =1/W 处可以达到. 

根据原来的变量，最优的公共工作计划是修建; c = 3;c, =3/力》2.1百英里的公路和桥梁以及 
y = 2;c 2 = 力 = 1.4 百英亩的公园和娱乐场所.最优工作计划是限制曲线和无差别曲线 
q ( x , >0 = 3恰好相交的点，具有更大效用的点 hy) 位于和限制曲线不相交的无差别曲线上，见 
图 7-11. 



练习题 



公路和桥梁 

图 7-11 最优公共工作计划是 （2.U.4) ■ 


1. 设2(幻= 3々 2 +34+2;^ 2 ,求一个变量代换，将 G 变换成一个不含交叉项的二次型，且给出新二次型. 

2. 对练习题1中的 G, 求 GOO 在限制条件 x T x = l 下的最大值，且求出达到最大值的单位向量. 


习题 7.3 

在习题1和习题2中，求变量代换 x = 0 ，将 
二次型 x t Ac 变换为对应的 y r Dy . 

1. 5xx ■ 1 t6xl^lxl+ Ax x x 2 - 4^3 =9yf 

2 . 3 々 2 + 2 文 2 2 + 2 ; c 3 2 + lx x x 2 + 2 ^ jc 3 + 4^ 3 = 5^ 2 + 2y\ 
(提 示：太和^ 必须有同样数目的坐标，这样， 
这里显示的二次型关于 W 的系数一定为零 .） 

对习题 3 〜 6 ,求 （a) 在条件 x T x = l 限制下， Q(x) 
的最大值， （b) 达到最大值的一个单位向量 U ，( C ) 在 


条件 x T x = l 和 x T W = 0 限制下， GU) 的最大值. 

3. Q{x) = 5xf + 6x1 + 1x1 + 4x^2 - 4x 2 x 3 (见习题 1 ) 
4- 2(幻= 3文1 2 + 2乂 + 24 + 2 X[X 2 + 2 xiX^ + 4文2々 （ 见 
习题 2) 

5. Q ( x ) = 5 xi + 5 x 2 - ^ x { x 2 

6 . Q(x) = 7xi +3x1 + 3x } x 2 

7. 设 Q(x) = -2x\ - x\ + 4x^ 2 + 4x 2 x 3 ,在条件 
x T x = l 的限制下，求出在 1R 3 中的单位向量 x 
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使 G ( x ) 取最大值 •（提示： 二次型 G 对应矩阵 
的特征值是2, -1 和 -4.) 

8. 设 Q ( x)=lxt + JC2 +7 jc 3 1 2 - 8 jc , jc 2 - 4 x , x 3 -8 oc 2 oc 3 ，在 
条件 x T x = l 的限制下，求出 R 3 中的单位向量 
X ， 使得 G ( x ) 最大 .（ 提示： 二次型 C 对应矩咗 
的特征值是9和 -3. > 

9. 在条件 jc ? +4=1的限制下，求出 G 00 = 7 J «? + 
3 x 卜 2 x , x 2 的最大值 .（ 不必求出达到最大值的 
向量 .） 

10. 在条件 Jt ? + =1的限制下，求出 Q ( x ) = - 3 xi + 

5 xl - 2 x lX2 的最大值 .（ 不必求出达到最大值 
的向量 .） 

11. 若 jc 是矩阵 A 对应特征值3的一个单位特征 
向量， * T Ac 的值是什么？ 

12. 设 A 是对称矩阵 A 的一个特征值，验证本节的 

练习题答案 


一个结论即，此处 wi 和 M 的定义在 
(2) 式中给出 .（ 提示： 求出 x 使得； l = x T Ac.) 

13. 设 A 是 nxn 对称矩阵， M 和 wi 表示二次型 

x T At 的最大值和最小值，且对应的单位特征 
向董是叫和〜，下面的计算表明，对任意给 
定的介于 M 和 m 之间的数有一个单位向量 
x ,使得 f = JcMx ,验证对0和1之间的数 a ， 
t = (\- a ) m+aM ,然后令 x = + , 

证明 x t jc = 1 且 jc t Aic =/ . 

[M] 请依据习题 3~6 给出的说明做习题 14-17. 

14. x,xi+ 3JHJtj+ 30 jhx 4 + 30x 2 X] + 3x 2 x t + x 3 x t 

15. 3x,Xi + 5x,xj+ lx,x t + lx 2 Xj + Sx 2 x, + 3jc 3 x 4 

16. 4jtf- 6x t x 2 - IOjujcj- lOatiXj-6 jc 2 jc 3 - 6x 2 xt - 2x^x A 

17. -6xl -104 -1-1- 4jc,jc 2 - 4jciJC 3 -4jciX 4 + 

6 xjX 4 


1. 二次型的矩阵 A = 很容易求出特征值 4 和2,对应的单位特征向和所以期 

望的变量代换是 * = 办，此处 P = _1/ H (—个常见的错误是忘记将向量单位化.新的二次 

[l/yf2 Uyf2\ 

型是 + 

2. 对单位向董 jc , Q(x) 的最大值是4,且取得最大值时的单位向量是一个常见的错误答案是， 

这个向量使二次型/办而不是 GOO 达到最大值）-见图 7-12. 



图 7-12 G ( J 0 在限制条件 x T x=l 下的最大值是4 
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7.4 奇异值分解 

5.3 节和 7.1 节的对角化定理在许多应用中均很重要，然而，如我们所知，不是所有矩阵都 
有分解式 A = 且 D 是对角的.但分解 A = GDP __ 对任意矩阵 A 都有可能！这类特殊 

分解称为奇异值分解，是线性代数应用中最有用的矩阵分解. 

奇异值分解基于一般的矩阵对角化性质可以被长方形矩阵 模仿： 一个对称矩阵 A 的特征值 
的绝对值，表示度董 A 拉长或压缩一个向童（特征向量）的 程度； 如果且 | jc || = 1, 
那么 

|Ar| = |Ax|| = |A|||x| = |A| ( 1 ) 

如果不是具有最大数值的特征值，那么对应的单位特征向量 V ,， 确定一个由 A 拉长影响最 
大的方向，也就是 （1) 式表示当 jc = > ^时， /U 的长度最大化，且11/^11 = 1；^ I . 这个对 v, 和|人|的 
描述对于长方形的矩阵来说也是类似的.这将导致奇异值分解. 

例1如果 A = |^ ,那么线性变换 jch /U, 将 R 3 中的单位球 { jc :|| x 卜 1} 映射为 R 2 

中的椭岡，见图 7-13. 找出使得长度 ||/U|| 最大的一个单位向量: c, 且计算这个最大长度. 



图 7-13 从 R 3 到 R 2 的一个变换 


解 使 ||^r 的值最大化的X同样使 ||Ar|| 的值最大化，但 ||Acf 更容易计算，注意到 
|/U:| 2 = (i4jt) T (>bc) = x t A t Ax = x t (A t A)x 

由于 A t A , A T A 也是一个对称矩阵.所以，现在的问题转化为在条件 || jc || = 1 限 
制下，二次型 jc t ( A t A)jc 的最大化.这是 7.3 节的一个问题，且我们知道它的解答.利用定理6, 
最大值就是矩阵 A T A 的最大特征值，同样，最大值可以在 A T A 特征根;^对应的单位向量处获得. 
对本例中的矩阵 A , 

' 4 8 > 4 I, 141 80 100 40 1 

A J A = 11 7 I 7 2 = 100 170 140 

14 -2_|[ _」 40 140 200 

矩阵 A T A 的特征值是不=360, ^=90和人=0,对应的单位向量分别是 
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"1/3' 


-2/3' 


_ 2/3 

Vi = 

2/3 

, v 2 = 

-1/3 

， v 3 = 

-2/3 


2/3 


2/3 


1/3 


I 射 || 2 的最大值是360,且在0：为单位向量 v ,# 获得，向量 A Vl 是图 7-13 中椭圆上离原点最远的 
点，即 


"1/3' 

2/3 = 

2/3 

对 M = 1， |如| 的最大值是 | Av ,| =涵= 6掘. 

例1说明， A 对 K 3 中单位球面的影响，与二次型 x T ( A T A ); c 有关，事实上，变换的 
全部几何特性都可用二次型来说明，下面我们将说明这个问题. 




—个 mxn 矩阵的奇异值 


令 A 是 mxn 矩阵，那么 A T A 是对称矩阵且可以正交对角化，让 { v ,， …， v „} 是 1 T 的单位正交 
基且构成 A T A 的特征向量， A ■，…又是 A T A 对应的特征值，那么对 UWn ， 

|Av f | 2 =(Av,) t Av, =vjA T Avi 

= v, T (A,v f ) 由于 v , 是的特征向量 （ 2) 

=^i 由于 v, 是单位向量 

所以， A T A 的所有特征值都非负，如果必要，通过重新编号我们可以假设特征值的重新排列满 
足 


\ ^ ^2 >0 

A 的奇异值是 A T A 的特征值的平方根，记为 (7,, …，(7„，且它们用递减顺序排列，也就是对 
lO ' Sn ， （7,=# •由 （2) 可知， A 的奇异值是向量 A Vl ，…,，1^的长度. 

例2令 A 是例1中的矩阵，由于 A T A 的特征根是360, %和0， A 的奇异值是 
( T , = >^60 = 6 VlO , a t = V 90=3 Vl 0, ct 3 =0 

从例 1 可知， A 的第一个奇异值是|如||在所有单位向量处的最大值，且最大值可以在单位 
向量 v , 处获得_ 7.3 节的定理7表明， A 的第二个奇异值是，||如||在所有与》^正交的单位向量上 
的最大值，且这个最大值可以在第二个单位特征向量 v 2 处获得（习题 22) _对例1中的 v 2 ， 


Av 2 = 



-2/3" 

-1/3 

2/3 



这个点在图 7-13 中椭圆的短轴上，像 Av , 在长轴上一样（见图7-14)，矩阵4的前两个奇异值 
是椭圆长半轴和短半轴的长度. 
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图 7-14 ■ 

事实上，像下面定理所说，图 7-14 中的 Av ,* Av 2 E 交不是偶然. 

定理9假若 { vwj 是包含 A T A 特征向量的 1 T 上的单位正交基，重新整理使得对应 
A T A 的特征值满足 A > 彡…彡; l „. 假若4有;•个非零奇异值，那么 { Av , ，…， Av r } 是 ColA 的一个正 
交基 ， JL rank A = r . 

证由于当时， v ,. 和；正交，所以 

( Av , ) T (Av ； ) = v, T A T Av y = v, T ( A y v y ) = 0 

那么 { Av , ，…， Av „} S —个正交基，更进一步，由于向量 Av ,, …,， 1 ^的长度是 A 的奇异值，且因 
为有 r 个非零奇异值， AvjO 的充分必要条件是所以 Av , .…， Avj 线性无关向量，且 
属于 ColA _ 最后，对任意属于 ColA 的 _ v ，如 _ v = 鈕，我们可以写出;… + Cn v „, 且 
j = Ar = c , Av , + ••• + c r Av r + c r +1 Av r+1 + •.. + c n Av n 
-c x Av x + •■• + c r Av r + 0 + ..- + 0 

这样， _V 在 Span { Av ,, …， Av r } 中，这说明 { Av ,,...， Av r } 是 Col A 的一个正交基.因此 rankA = 
dim(Col A) = r . ■ 

数值计算的注解在一些情形下， A 的秩对 A 中元素的微小变化很敏感，如果用计算 
机对矩阵 A 作行简化，明显矩阵 A 的主元列数目的计算方法效果不好，舍入误差常导 
致满秩的阶梯矩阵. 

实际上’估计大矩阵的秩时，最可靠的方法是计算非零奇异值的个数，在这种情 
形下，特别小的非零奇异值在实际计算中常假定为零，矩阵 A 的有效秩是剩余非零奇 
异值的数目戶 
奇异值分解 

矩阵 A 的分解涉及一个 mxn “对角”矩阵2,其形式是 
1=1"° °] 

L 0 0」 m-rn ( 3 ) 

^—— m_r 行 

此处’ D 是一个 rxr 对角矩阵，且/■不超过 m 和 n 的最小值（如果 r 等于;„或„，或都相等，则 


0 —般地，秩的估计问题并不简单，对这个问题的详细讨论见 Philip E. Gill, Walter Murray，and Margaret H. Wright, 
Numerical Linear Algebra and Optimization, vol.l (Redwood City, CA: Addison-Wesley, 1991), 5.8 节， 



对称矩阵和二次型 


417 


M 中不会出现零矩阵） • 


定理10 (奇异值分解） 

设 A 是秩为 r 的 mxn 矩阵， 那么 存在一个类似 （ 3 ) 的 mxn 矩阵2；，此处 D 的对角线元素 
是 A 的前 r 个奇异值， cr, >cr 2 >0,并且存在一个 mxm 正交矩阵和一个 nxn 正交矩 

t 

阵 V 使得 A=t/2；V T . 

任何分 WA = t/2；V T 称为 A 的一个奇异值分解（或 SVD), 其中 f/ 和V是正交矩阵，2；形如 
(3) 式，且 D 具有正的对角线元素，矩阵 C/ 和V不是由 A 惟一确定的，但2；的对角线元素必须 
是 A 的奇异值，见习题19,分解中 C7 的列称为 A 的左奇异向置，而V的列称为 A 的右奇异向置. 

证假 设入和 V,如定理9,使得 {Av,， …, AM 是 Col A 的正交基，将每一个 Av, 单位化得到一 
个标准正交基心}，此处 


而且 


Av , = CTjMi ( l^i^r ) 


现在将 { Kl , …， M 扩充为 IT 的单位正交基而且取 
t/=[Kl K 2 … K m ] 和 V =[v, V 2 


… V„] 


由构造可知， t/ 和V是正交矩阵，同样由 （4) 


AV = [Av, ••- Av r 0 ••- 0] = [(T 1 « 1 ••- a r u r 0 ••- 0] 
设£»是对角元素为 CT, ，…, A 的对角矩阵，且 S 是上面 （3) 中的形式，那么 


t/Z = [«, u 2 ---u m ] 


0 


02 

0 

0 G t 


0 

0^ 


= [(7,1^ … (T r M r 0… 0] 
= AV 


(4) 


由于V是一个正交矩阵， ULV T =AW r =A. ■ 

下面的两个例子注重于讨论奇异值分解的内部结构.一个快速而数值稳定的分解算法将会 
使用另外一种方法.参见本节末尾处的“数值计算的注解”. 

例3使用例1和例2中的结果求 A = @ ^ 的一个奇异值分解. 

解一个奇异值分解可分三步进行. 

第一步.将矩阵 A T A 正交对角化.即求矩阵 A T A 的特征值及其对应的特征向量的标准正交 
集.如果 A 只有两列，其计算可以手算完成.对规模较大的矩阵通常需要使用矩阵程序.而对此 
处的矩阵 A ，在例1中已经给出了 A T A 的特征值及其相应的特征向量. 

第二步.算出V和 2；. 将 A T A 的特征值按降序排列.在例1中，特征值已经按降序排列:360, 
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90, 0. 它们对应的单位特征向量分别为 VhVhVh 是 A 的右奇异向量.使用例1的结果，构造 

"1/3 -2/3 2/3' 

V — [v\ v 2 v 3 ] = 2/3 -1/3 -2/3 
2/3 2/3 1/3 - 

特征值的算术平方根就是奇 异值： V , = V 360=6 VlO , ( T 2 = V 90=3 Vi 0, o 3 =0. 

其中的非零奇异值就是矩阵 D 的对角元素.矩阵2；与矩阵 A 的行列数相同，以矩阵 D 为其左上 
角，其他元素为 0. 


eVIo 


3^ 


， I=ID 0 ]： 


fWlS 


0 3Vl0 OJ 

第三步.构造 t /. 当矩阵 A 的秩为 r 时，矩阵 t / 的前 r 列是从 Aiv . Aiv 计算得到的单位向量. 
此例中， A 有两个非零奇异值，因此 rankA = 2. 根据例 2 之前的内容和方程 （ 2 )，有 lAvil^cr,, 
||Av 2 || = (T 2 ,于是 


^ Avi = m \ 6」 


1 「 3i_r i/Vio" 

3Vio[-9j -3/Vio_ 


留意到 {«,,« 2 } 已是 K 2 的一个基，因此构造 t / 不需另外的向量， « 2 ], A 的奇异值分解是 

A _ [3/715 1叫[6凋0 0] 「 1/3 2/3 2/3 ] 

l_i/Vio -3/715」 L 0 3V10 oj 


-2/3 -1/3 2/3 
2/3 —2/31/3 


例4求 A : 


-2 2 
2 -2 


的一个奇异值分解. 


解首先，计算 A t A = 


9 -91 


A T A 的特征值是 18 和 0, 相应的单位特征向量是 


这两个向量构成 V 的列 向量： 


V =[ v , V 2 ] = 


' m 4 i 

_1/V2_ 


[-1/72 1/72] 


_-l/V2 l/Wj 

矩阵的奇异值为 CT , =^ = 3力， （ T 2 =0. 因为只有一个非零的奇异值，“矩阵” D 可写成单个数 
值，即 D = 3 V ^. 矩阵 S 与矩阵 A 的行列数相同，以矩阵 D 为其左 上角： 
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1= 


D 01 
0 0 


—yji 0 
0 0 



|_o oj 

[° ° 

J 


- 2/yl2 


0 

AVi = 

-Al^2 

, Av 2 = 

0 


4/yf2 


0 


为构造 t /， 首先计算 AViftAh : 


为检査计算，验证当然， Av 2 =0. 因为 | Av 2 | = (T 2 =0. 目前只找到 t/ 的 
一列是 

( 1/31 

- Av \ 




-2/3 

2/3 


C / 的其他列是将集合 { u ,} 扩充为的标准正交基而得到的.此时，我们需要两个单位正交向量 
且都与叫 正交. （见图 7-15.) 每个向量必须满足1^ = 0,这等价于方程々-2知+ 24=0,该 
方程的解构成的基是 


•2. 


-2 

1 

，矽 2 = 

0 

0 


1 


( 经检验〜和 w 2 都与 Bl 正交 J 应用格拉姆-施密特正交法于 { W| , 
w 2 ], 可以得到 



US 


-2 / >/45* 

«2 = 

\lyl5 

.«3 = 

4 / >/45 


0 


5 / >/45 


最后.令 t /=[ U| u 2 u 3 ] ，以及由上所得的和5：，那么 


1 -1" 


1/3 2lS -2 / >/45 _ 

~3yf2 o' 

-2 2 

= 

- 2/3 IfS 4 / >/45 

0 0 

2-2 


2/3 0 5 / >/45 

0 0 


l / y /2 -1 /W 
l/yf2 l/yf2 



奇异值分解的应用 

如上所述，奇异值分解常用于估计矩阵的秩，某些数值计算的其他应用，下面简单叙述它 
在数值计算中的其他应用 . 7.5 节给出一个奇异值分解在图像处理的应用 • 

例5 ( 条件数）当应用矩阵 A 的奇异值分解时，多数涉及方程 Ax = b 的数值计算要尽可 
能的可靠.两个正交矩阵 " 和 V 不影响向量的长度和两个向量的夹角 （6.2 节定理 7). 数值计 
算中的任何不稳定因素都与 Z 有关. 如果 A 的奇异值非常大或非常小，舍人误差几乎不可避免， 
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此时，知道 Z 和 V 中的元素对分析误差特别有用. 

如果 A 是一个 nxn 可逆矩阵，那么最大奇异值和最小奇异值的比率给出矩阵 A 的 
条件数 ， 2.3 节的习题 41-43 表明，条件数如何影响的解对 A 的元素变化（或误差）的 
敏感程度（事实上， A 的“条件数”可用几种方 式计} I ：,但这里给出的定义可广泛用于 Ac 
的研究）. ■ 

例 6( 基本子空间的基）给定 mxn 矩阵 A 的一个奇异值分解，取 Ul ， 是左奇异向量， 
V ,,…, V ,是右奇异向量，且 ( T ,, …， A 是奇异值， r 为 A 的秩，由定理9， 

[Ui, -,Ur] (5) 

是 Col A 的一个单位正交基.见图 7-16. 

回忆 6.1 节的定理3， ( CoM) x = Nul ,因此 

{“”,，•••，“„} (6) 

是 NulA T 的一个标准正交基. 

由于当1 < K 时 lAv.ll = a , ,且 < T , 是零的充分必要条件是 
i>r , 向量 Vm , …， v n 生成一个维数为 ( n - r ) 的子空间 NulA . 由秩 
定理可知 ， dimNuM = n-rank A ,从而说明 

{v, + i, -,v B } ( 7 ) 

是 NulA 的一个标准正交基，见 4.5 节的基定理. 

从（5> 和（6)，空间 NuM T 的正交补是 ColA , 将 A 和 A T 交 
换，我们有 

( NulAPnCol^sRowyl 

因此，从 （7) 得 

{v,，...，M (8) 

是 Row A 的一个标准正交基. 

图 7-17 给出 （ 5 ) ~ ( 8 ) 的总结，但说明的是 {< T 炎，…， 

为 ColA 的正交基,而不是标准基.注意到，对1 < i < »•，从= au ,. 

由 A 确定的四个基本子空间的标准正交基在某些计算中非常有图 7-16 例6中的基本子空间 
用，特别在条件优化问题中更是如此. 
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四个基本子空间和奇异值的概念给可逆矩阵定理提供了最后的命题 .（ 回忆为了避免几乎 
将可逆矩阵定理的命题数目翻倍，定理中已将与，有关的命题删除了 .） 可逆矩阵定理的其他 
命题在 2.3 节、 2.9 节、 3.2 节、 4.6 节和 5.2 节中已经给出. 

定理（可逆矩阵定理（最后补充 ）） 

设 A 为矩阵，那么下述命题中的每一个都与 A 是可逆矩阵的命题等价. 
u. (ColA) 1 ={0}. 

V. (NulA) 1 =K". 

w. Row A = IT . 

x. 义有《个非零的奇异值. 


例7 ( 奇异值分解的简化和 A 的伪逆） 
分解，利用上面建立的符号 ， Sr = mnkA ， 
U = [u r u m . r ], 
V = [K V_], 


当 I ： 包含零元素的行或列时，矩阵 A 具有更简洁的 
将和 V 矩阵分块为第一块包含 r 列的子 矩阵： 
其中… bJ 
其中 K = [ v , ••• vj 


那么 R 是 mxr 和 K 是 nxr . 
分块矩阵的乘法表明 


(为简化符号，我们考虑和即使其中一个没有任何列 .） 


A = :腦 （9) 

矩阵 A 的这个分解，称为 A 的简化的奇异值分解.由于 D 的对角元素非零，我们得到下列形式 
的矩阵，称为 A 的伪逆（也称穆尔-彭罗斯 逆）： 


A + =V r D'Uj (10) 

本章最后的补充习题 12~14 研究了简化的奇异值分解和伪逆的一些性质. ■ 

例 8( 最小二乘解）给定方程 Ac =6,利用式 （10) 中给出 A 的伪逆，定义 
x = A + b = V r D'Ujb 
那么由 （ 9) 式中的奇异值分解得到 

Ax = (U r DV r T )(V r D'Ujb) 

= U r DD 'Ujb 由于 vH 

= U r Ujb 

从 （5) 式可知，是 ft 在 Col A 上的正交投影6 ( 见 6.3 节定理10)，因此 i 是如 的最 
小二乘解，实际上，这个 i 在如 =6的所有最小二乘解中具有最小长度，见补充习题 14. 


数值计算的注解 例 1~4 和习题说明了奇异值概念并给出如何手工计算，实际上，应 
该避免 A T A 的计算，原因是任何 A 中元素的误差在 A T A 中被 平方. 存在快速的迭代方 
法，可计算精确到很多位数的矩阵 A 的奇异值和奇异向量. 
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练习题 

给定一个奇异值分解， A = f/ZV T , 求 A T 的一个奇异值分解， /I 和的奇异值有什么联系？ 


习题 7.4 

求习题 1~4 中矩阵的奇异值分解 . 

3. H [I 

求习题 5~12 中每个矩阵的奇异值分解.（提 


示： 在习题 11 中，一个£/的选择可以是 


-1/3 2/3 2/3 

2/3 -1/3 2/3 , 习题 12 中£/的一个列可 

2/3 2/3 -1/3 


- 1/V6' 

以是 -2IS.) 


1 /V6 




•4 

-2 

10. 

2 

-1 


0 

0 


11. 

•-3 

6 

1' 

-2 

12. 

1 1' 

0 1 


6 

-2 


-1 1 


13. 求 = g ^ 的奇异值分解（提 示：对 
A T 进行分解 ）. 

14. 在习题 7 中，求一个单位向量 x ，使得 At 具 
有最大长度 . 

15. 假设下面是矩阵 A 的奇异值分解，其中£/和 V 
的元素是四舍五人精确到小数点后两位数字 . 



0.40 

-0.78 

0.47' 


7.10 

0 

0' 


0.37 

-0.33 

-0.87 


0 

3.10 

0 


-0.84 

-0.52 

-0.16 


0 

0 

0 


「 0.30 -0.51 -0.81' 


x 0.76 0.64 -0.12 

[0.58 -0.58 0.58] 

a. A 的秩是多少？ 

b. 利用的这个分解，不用计算，写出 Col/l 
的一个基和 Nul/l 的一个基 . （提示：首先 
写出 V 的列 .） 

16. 对下列 3x4 矩阵 /I 的奇异值分解，重做习题 15. 


© 该书中文版已由机 tttDlk 出版社引进出版。一编辑注 
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•-0.86 

-0.11 

-0.50" 

'12.48 

0 

0 

O ' 

A = 

0.31 

0.68 

-0.67 

0 

6.34 

0 

0 


0.41 

-0.73 

-0.55 

02.48 

0 

0 

0 


- 0.66 -0.03 -0.35 0.66" 

-0.13 -0.90 -0.39 -0.13 
X 0.65 0.08 -0.16 -0.73 

-0.34 0.42 -0.84 -0.08 

在习题17~24中，/ I 是一个 mxn 矩阵，具有 

奇异值分解 A = f / ZV T ,此处 f / 是一个 mxm 正交 

矩阵， Z 是一个“对角”矩阵，有/•个正元素，没 

有负元素， V 是一个 nxn 正交矩阵，验证每一个 

答案. 

17. 若 A 是可逆方阵，求的奇异值分解. 

18. 证明： 如果/ I 是方阵，那么 | detA | 是/ I 的奇异 
值的乘积. 

19. 证明： V 的列是 A T / l 的特征向量，£/的列是 
AA T 的特征向量，而5：对角线上的元素是 A 的 
奇异值 .（ 提示：利用奇异值分解计算 A T A 和 
AA T .) 

20. 证明 ：如果 / I 是 nxn 且正定的矩阵，那么/ I 的 
正交对角化 A = PDP T 就是/ I 的奇异值分解 • 

21. 证明：如果 P 是一个 mxm 正交矩阵，那么 
PA 与有同样的奇异值. 

22. 验证例2中的论断，当 x 变化范围属于所有垂 
直于 V ,的单位向量时，矩阵 A 的第二个奇异值 


是， || Ac | 的最大值，这里 V, 是对应 A 的第一个奇 
异值的右奇异向量.（提示 ：利用 7.3 节的定理 7.) 
23•如果 {/=[«, …… v „], 证明： 


A= aiu^vj + <t 2 « 2 V 2 + •■• + a r u r vj 

24. 利用习题23的记号，说明对 = 
rank A , ；4 1 '1^=<7 ; 〜成立. 

25. 令 r : R ” R " 是线性变换,描述如何求 R " 的 


基 fl 和] R m 中的基 C , 使得矩阵 r 相对于 fl 和 


C 是一个 mxn “对角”矩阵. 

[ M ] 计算习题26和习题27中每一个矩阵的奇 
异值分解，最后的矩阵元素精确到两位小数，利用 
例3和例4的方法. 

「-18 13-4 41 


- 2 21 48 


27. 




' 6 -8 ^ 5 -4 

2 7-5-6 4 

0 - 1-8 2 2 

-1 -2 4 4 -8 


28. [ M ] 计算 2.3 节习题9中 4 x 4 矩阵的奇异值，并 
且计算条件数 (7,/( J 4 . 

29. [ M ] 计算 2.3 节习题10中 5 x 5 矩阵的奇异值， 
并且计算条件数 ( VA . 


练习题答案 


如果 zl = f / ZV T ， 此处 Z 是 mxn 矩阵，那么 / l T =( V T ) T Z T f/ T = VZ T f / T ， 这是的一个奇异值分解，原 
因是 V 和£/是正交矩阵，且 S T 是一个 nxm “对角”矩阵，由于 Z 和 S T 具有同样的非零对角元素，/ I 和 /T 
具有同样的非零奇异值.（注意：如果/ I 是 2 xn 矩阵，那么 AA T 仅为 2 x 2 矩阵，且它的特征值比 A T / l 的 
特征值更容易（手工） 计算 .） 

7.5 图像处理和统计学中的应用 


本章介绍性实例中的卫星图像问题给出一个多维或多变量数据的例子，组织数据后使得数 
据集合中的每组数据可看成是 K " 的点（向量），本节的主要目标是介绍主成分分析的方法，用 
于分析这类多维数据的技巧.计算将说明正交对角化和奇异值分解的应用 方法. 
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主成分分析可用于任何数据，包括测量清单上采集的对象或个体.例如，研究生产塑料材 
料的化学过程时，为了监控生产过程，在材料生产过程中取得300样本，且每一个样本经过8 
个一组的测试_如熔化点，密度、粘性、抗拉强度等等，实验室的每一个样本报告是一个属于 
的向量，且这类向量集合形成一个 8 x 300 的矩阵，称为观测矩阵 • 

粗略地讲，我们可以说控制过程的数据是8维的，下面两个例子中描述的数据可以用图形 
给出. 

例1 一个二维数据的例子是， W 个大学生关于体重和身高的一组数据，令 X ;表示 K 2 中 
的观测 向置， 它列出第 y 个学生的体重和身高，如果用 w 表示体重， A 表示身高，那么观测矩 
阵的形 式为： 



■^1 ^2 x N 

观测向量的集合可以形象地表示为一个二维散列图，见 h 

图 7-18. _ 

例2本章介绍性实例中，关于内华达州铁路峡谷 .... 又 

的前三幅图可以作为某区域的具有三个光谱分量的图 
原因是它们在三个独立的波长同时给出该区域的度 

量，每幅图给出同一自然区域的不同信息.例如，每幅 ~| - -- 

图中位于左上角的第一像素对应地面的同一位置 （大约 图: ms 观测向量的散列图 

30米 x30 米）. 每一个像素对应着 K 3 的一个观测向量，它列出了该像素在三个光谱段中的信号 
强度. 

典型的图形是 2 000>< 2 000 像素，使得图像有 4 百万像素，图像的数据形成一个 3 行和 4 百 
万列的矩阵（列可以调整为方便的次 序）. 在这种情形下，数据的 “多维” 特征是指 3 个光谱 
维数，而不;1 自賴顿 獅二维空醜[馳许細7_19所示，縣地転力 K 3 中的4 
百万个点. 
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均值和协方差 

为准备主成分分析，令 [ A ：, …是如上描述的一个 px / V 观测矩阵，观测向量 A ：,, …, 
的样 本均值 A /， 由下式给出 


Af + '" + X n) 

对图 7-18 中的数据，样本均值是散列图的中心，对* = 1,...,7V, 令 
Xt=X k -M 

px / V 矩阵的列 

B=Lx t x 2 - X N ] 

具有零样本均值，这样的 B 称为平 均偏差 形式. 当图 7-18 中的数据减去样本均值后，得到的散 
列图具有图 7-20 的形式. 


图 7-20 平均偏差形式的体重-身高数据 
(样本）协方差矩阵是一个 pxp 矩阵其定义为 


S ~l BB 


由于任何具有形式的矩阵是半正定的，所以 S 也是半正 定的. （见 7.2 节的习题25,互换 
S 和 S T .) 

例 3从一个总体中随机取出4个样本作三次测量，每一个样本的观测向量为： 


计算样本均值和协方差矩阵. 
解样本均值是 



r 


~ 4 


7' 


•8_ 

x t = 

2 

， X 2 = 

2 

， X ,= 

8 

, X 4 = 

4 


■ 1 」 


13 


1 


5 


rrr 


' 4" 


'7* 


'8" 

2 

+ 

2 

+ 

8 

+ 

4 





_1 


5_ 


从 A ：,， …，中减去样本均值，我们 得到: 
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"_4" 




' 2 


'3* 

X ,= 

-2 

, X 2 = 

-2 

8 

，龙3 = 

4 

-4 

，夂= 

0 

0 


并且 


样本协方差矩阵为 


'-4 -1 2 3' 

B= -2 -2 4 0 

-4 8-4 0 


[-4 -1 2 3— 

5=- -2 -2 4 0 

3 [-4 8-4 0 

「30 18 0' 

=— 18 24 -24 = 

0 -24 96 


"^1 -2 -4' 
- 1-2 8 

2 4-4 

3 0 0 

10 6 0 ' 

6 8-8 
0 -8 32 


■ 


为了讨论5 =[〜]中的元素，令表示在观测向量集合中变化的向量，且; c ,， …,; c p 表示 X 的 
坐标，那么例如， ； c ，是一个在 a ：,， …，集合中变化的第一个坐标的数值， 

对角元素\称为 JC , 的方差. 

心的方差用来度量 七值的 分散性（见习题13)，在例3中，&的方差是10,七的方差是 
32, 3 2 大于10的事实说明，对应向量第三个元素的集合包含比第一个元素的集合更大的取值 


范围. 


数据的总方差是指; S 中对角线上方差的 总和. 一般地，一个方 阵;？ 中对角元素之和称为矩 
阵的迹，记作 tr (幻，这样 


{ 总方差 } = trCS ) 

S 中的元素〜 （) 称为; c ,. 和 〜的协 方差.观察例3中的协方差， ； c ，和 jc 3 的协方差是零， 
因为 S 中的 (1,3) 元素是零，统计学家称 々和 々是无关的.如果大部分或所有变量々，…，七是无关 
的，即当 A ：,， …,的协方差矩阵是对角阵或几乎是对角阵时，则中多变量数据的分 
析可以简化. 


主成分分析 

为简单起见，假设矩阵 [ A ：, … ATJ 已经是平均偏差形式，主成分分析的目标是找到一个 
/ JX / J 正交矩阵 P = [ B , … B p ], 确定一个变量代换,或 




Jl" 

义2 

= [Hl U 2 '*U p ] 




■: V 
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并具有新的变量九…，心两两无关的性质，且整理后的方差具有递减顺序. 

变量的正交变换 = 说明，每一个观测向量 X * 得到一个“新名称” r ,， 使得 
注意到 K 是相对于以 P 的列为基的坐标向量，且对 ; t = l , … ,7 V 有 h = p -%= P T X t . 

不难验证，对任何正交矩阵的协方差是(习题 11). 于是，期望的正交 
矩阵 P 是一矩阵使得，奸为对角形_设 D 是对角形矩阵且 S 的特征值; L …,;^位于对角线上， 
重新整理使得;…并记 P 是正交矩阵，它的列是对应单位特征向量 
那么5 1 = PDP r 且有 P T SP = D . 

协方差矩阵 S 的单位特征向量,•••,«,，称为（观测矩阵中的）数据的主成分. 第 一主成 
分是 S 中最大特征值对应的特征 向量. 第二主 成分是 S 中第二大特征值对应的特征向量，以此 
类推. 

第一主成分《,可用下列方式确定新变量力，设 C,, …，是中的元素，由于 < 是 P T 的行， 
方程 F 表明 

力 =ujx =CiXl +c 2 x 2 + ■■■ + c p x p 

于是;原变量 JT ,. …， h 的线性组合，并用特征向量 B , 中的元素作为权值.同样的方式，1< 2 确 
定变量乃，以此类推. 

例 4 铁路峡谷（例 2 )的多谱图像的初始数据包含 R 3 中 4 百万个向量，其协方差矩阵是 
"2 382.78 2 611.84 2 136.20' 

S= 2 611.84 3 106.47 2 553.90 
2 136.20 2 553.90 2 650.71 
求数据的主成分，且列出由第一主成分确定的新变量. 

解 5的特征值和相关的主成分 （ 单位特征向量）是 

A, =7 614.23 Aj = 427.63 A, =98.10 



"0.541 1~ 


'-0.489 4 


' 0.683 4' 

«1 = 

0.629 5 

«2 = 

-0.302 6 

«3 = 

-0.715 7 


0.557 0 


0.817 9 


0.1441 


为简化而用小数点后两位小数，第一主成分的变量是 

^1 = 0.54々 + 0.63 jc 2 + 0.56 jc 3 

在本章介绍性实例中，这个方程用于生成图 7 - ld . 变量 jc ,, jc 2 ， jc 3 是三个光谱段中的信号强度.将 
々的值转化为介于黑色和白色之间的灰度，生成图 7- la _ 类似的，心和^的值分别生成图 7 -lb 
和 c . 对图 7- ld 中的每一个像素，用％计算得到灰度值，即加权的 jc ,, jc 2 , jc 3 的线性组合.在这个 
意义下，图 7 -ld “显示”数据的第一主成分_ ■ 

在例4中，变换后数据的协方差矩阵，用变量表示 为： 

"7 614.23 0 0 ' 

D= 0 427.63 0 

0 0 98.10 

尽管£>比原来的协方差矩阵 S 明显简单，但构造新变量的优点仍然不明显.然而，变量％乃 
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的方差出现在对角矩阵£>的对角线上，并且明显看出£>中第一个方差比其余两个大得多•如我 
们将要看到的，这个事实允许我们将数据当作一维而不是三维的 • 

多变置数据的降维 

对大多数数据的变化或动态范围，当新变量％…， 3V 中的一些变量的变化较小时，主成分 
分析有潜在的应用价值. 

可以证明变量的正交变换， X=PY , 不改变数据的总方差.（粗略地讲，这个结论是真的， 
其原因是左乘 P 不改变向量的长度或它们的夹角，见习题 12.) 这说明，如果 S = 那么 

的总方差} = {九."，}^的总方差} = 11 '( 1 ))=^ 1 +_.. + 儿； ） 

力的方差是; I ,，且商 Vtr ^) 度量总体方差成分中，被乃“说明”或“记录”的比例. 

例5计算铁路峡谷例题中各种方差占总方差的成分，显示主成分的多光谱数据，在本章 
介绍性实例的图 7- ld~f 已经画出 • 

解 数据的总方差是 


tr ( D ) = 7 614.23 + 427.63 + 98.10 = 8139.96 
( 可验证这个数等于 tr (5).) 主成分在总方差的百分比分别是 


第一成分 

7 614.23 


第二成分 

427.63 _ 


第三成分 

98.10 


8139.96 8 139.96 8139.96 

其意义是，地球资源卫星关于铁路峡谷地区收集的93.5%信息显示在图 7- ld 上，5.3%显示在图 


7- le 上，而仅有剩余的1.2%显示在图 7- lf 中. ■ 

例5的计算表明，数据的第三个坐标实际上没有变化，乃的值几乎接近于零，从几何意义 
上看，数据点几乎位于平面 y 3 = 0 , 且它们的位置可由已知的> &相当精确地确定，实际上， 
%的方差也相对很小，这说明点集几乎位于一条直线上，数据几乎是一维的，见图7-19,其数 
据像一个冰棒棍. 


主成分变置的特征 

如果 y ,, …，^是来自一个 PX 7 V 观测矩阵的主成分分析，那么 yi 的方差在下列意义下可能尽 
量大，如果 U 是任意一个单位向量且 y = u T X , 那么当 X 在原来数据 X U -,X N 变化范围时， 3 ；的 
方差值为《 7 如，由 7.3 节的定理 8 ,在所有单位向量《中， b t 如 的最大值就是 S 的最大特征值 
不且这个方差可以在 b 等于对应的特征向量处达到.同样的方式，定理 8 表明 y 2 的方差最大 
值，可能出现在与无关的所有变量^ = «^尤中，同样地，为的方差最大值可能出现在与 y 和 
&都无关的所有变量中，以此类推. 


数值计算的注解 在实际应用中，奇异值分解是进行主成分分析的主要工具，如果 B 
是一个具有平均偏差形式的 pxTV 观测矩阵， JL^^.A = (1/ VaTT ) B t , 那么 A t A 是协方差 
矩阵 S . A 的奇异值的平方是； S 的 p 个特征值，且 A 的右奇异向量是数据的主成分. 


像 7.4 节所提到的， A 的奇异值分解迭代计算比;？的特征值分解更快更准确.在 
例如本章介绍性实例中提到的超谱图像处理 （ p = 224 ) 中，更是正确.在专业化的工 
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作站上，主成分分析可在数秒内完成 • 

进一步阅读材料 

Lillesand, Thomas M., and Ralph W. Kiefer, Remote Sensing and Image Interpretation, 
4th ed. (New York: John Wiley, 2000). 


练习题 

下表列出 5 个男孩子的体重和身高. 





mam 













■■IBH 



① 1 Ib=0.453 592 37 kg. ——编辑注 

② Iin=0.025 4m. ——编辑注 

1. 求数据的协方差矩阵. 

2. 给出数据的主成分分析，求一个数量指标来解释大多数数据中的变化. 


习题 7.5 

对习题1和习题2,将观测矩阵变为平均偏差 

形式，并构造样本的协方差矩阵. 

19 22 6 3 2 201 
12 6 9 15 13 5 J 
15 2 6 7 3"] 

3 11 6 8 15 11 J 

3. 求习题1中数据的主成分. 

4. 求习题2中数据的主成分. 

5. [ M ] —个地球资源卫星有三个光谱分量，由佛罗 
里达州 Homestead 空军基地 （ 自从1992年该基 
地被安德鲁飓风袭击后），所构造数据的协方差 
矩阵显示在下面，求数据的第一主成分分量，并 
且计算这个成分在总体方差中的百分比. 

"164.12 32.73 81.04' 

S = 32.73 539.44 249.13 
81.04 249.13 189.11 

6. [ M ] 下面的协方差矩阵来自华盛顿哥伦比亚河 
地球资源卫星的图像，采用数据的三个光谱段， 
令; c , , ; c 2 , ; c 3 表示图像中的每个像素的光谱成 
分，求新的变量形式 ； yi SCA + C 2 ； C 2 + C 3； C 3 具有最 
大可能的方差，限制条件是 C 1 2 + C 2 2 + C 3 2 =1，>>,中 


的数据占总方差的百分比是多少？ 

"29.64 18.38 5.00' 

5= 18.38 20.82 14.06 
5.00 14.06 29.21 

7. 令; c, , ;c 2 表示习题 1 中二维数据变量，求一个 
形如>>, =c,x,+c 2 x 2 的新变量； y , ，满足条件 
c , 2 + c 2 2 =1, 在给定数数据下，使得 的方差尽 
可能具有最大值，>>,中的数据占总方差的百分 
比是多少？ 

8. 对习题 2 的数据重复习题 7 的问题. 

9. 假设三个实验中，大学生的随机样本已经掌握， 
设尤，，…, L 是 R 3 中的观测向量，且对 
/ =1 , 2 , 3, Xj 表示第次考试中学生的分 
数，设数据的协方差矩阵是 

"5 2 0' 

5=262 
0 2 7 

设 y 表示学生表现的指标， Ky ^ c ^+^+ c ^ 
和? + cl + c 3 3 = 1 ,选取 c , , c 2 , c 3 ,使得 ； y 在数 
据集变化时，>>的方差尽可能大（提示：协方 
差矩阵的特征值是; 1 = 3, 6 和 9) . 
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'5 4 2 

10. [14]对5= 4 114,重复习题9的问题. 

2 4 5 

11. 给定平均偏差形式的多变量数据尤， 

属于 R f ), 尸是 pxp 矩阵，且对 
k = \ , 2,-,N , 定义 y t = P T Jf t . 

a . 证明： y „ y 2 ，…, y 〃是平均偏差形式.（提 
示： 令 是] ( T 中的向量且每一个元素为 
1,那么[尤,… nr 中的零向量 ）.） 

b . 证明： 如果的协方差矩阵是 
s， 那么 l y 2 , …,的协方差矩阵是 p t #. 

12. 令表示一个 pxW 观测矩阵的一个列向量， 
且令 P 是一个 pxp 正交矩阵，证明：变量变 

练习题答案 


换不影响数据的总方差 .（ 提示 ：由习 
题11，只需证明 tr ( P T 5 P ) = tr (5) ,利用 5.4 节 
习题25提到的轨迹的性质 .） 

13. 样本协方差矩阵是一个样本的; V 个测量数值 
的方差公式的一般形式，如，如果 m 是 
L … 々的平 均值，那么样本方差由下式给出 
⑴ 

证明前面例3中定义的样本协方差矩阵 S ，可 
以写成类似 （ 1 ) 的形式 .（ 提示： 利用分块矩 
阵的乘法，将 S 写成 1/( W -1) 乘 iV 个 pxp 矩阵 
的和，对用代替 i ».) 


首先将数据整理为平均偏差形式’容易看出样本的平均向量是财=130，从观测向量（表中的列）中 

65 


减去 M 可以得到 


那么样本协方差矩阵是 


「-10 -5 -5 5 151 


1-10 -5 -5 5 15 
一 一5 -1 3 7 


-10 -A 
-5-5 
-5 -1 
5 3 

15 7 


丄「400 190"| 一 「100.0 47.5' 
"4[_190 100 j = |_ 47.5 25.0 


2-5 的特征值是 （ 精确到两位小数） 

人 =123.02 和 1=1.98 

[ 0 9001 

0 ' 436 |(由于^是 2 x 2 矩阵，如果没有矩阵程序，则可以用手算 .） 为 

计算数量指标，取 


>> = 0.900 w + 0.436 A 

此处必和 A 分别表示平均偏差形式的体重和身高.在数据集合中该指标的方差是 123 . 02 .由于总方差 
tr (5) = 100 + 25 = 125 ,数量指标解释了几乎所有（98.4%)的数据 方差. 

练习题1的原始数据和由第一主成分“确定的直线，都显示在图 7-21 中 （ 用参数向量形式’直线是 
x = M+tu )- 在到直线的垂直距离的平方和最小的意义下，可以证明直线是数据的最佳逼近.事实上， 
主成分分析与术语 正交回 归是等同的，但正交回归完属于另外的内容’以后我们会遇到. 
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(英寸 ）65 


lb (磅） 

图 7-21 —个由数据的第一主成分确定的正交回归直线 


第7章补充习题 


1. 说明每一个论断是正确还是错误的，验证你的 

答案，在每一部分中， A 表示一个 nxn 矩阵. 

a . 如果 A 是可正交对角化矩阵，那么 A 是对称 
的. 

b . 如果 A 是一个正交矩阵，那么 A 是对称的. 

c . 如果 A —个正交矩阵，那么 ||Ar 卜 || x ||, 对所 
有 R " 的向量均成立. 

d . 二次型 x T Ar 的主轴可以是任意将 A 对角化 
的矩阵尸的列. 

e . 如果 P 是一个 nxn 具有正交列的矩阵，那么 
尸 T = P — 1 . 

f . 如果二次型的每一个系数是正的，那么二次 
型是正定的. 

g . 如果对某些 x , 有 x T At >0, 那么二次型 
x T At 是正定的. 

h . 通过适当的变量变换，任何二次型可以变成 
一个没有交叉乘积项的二次型. 

i . 二次型 x T Ar 在 || x || = l 条件下的最大值是矩 
阵 A 对角线上的最大元素. 

j . 一个正定二次型 x T Ar 的最大值是 A 的最大 
特征值. 

k . 一个正定二次型可以通过一个合适的变量 
变换 x = rti 变为负定二次型，其中 P 是正交 


矩阵. 

l. 一 个不定二次型是指特征值不定的二次型. 

m . 如果 P 是 nxn 正交矩阵，那么变量变换 
x = Ai 将 xMx 变换为矩阵为 P ' AP 的二次 
型. 

n . 如果是 mxn 且列正交的矩阵，那么 
是 x 在 Col 上的正交投影. 

o . 如果 S 是 mxn 矩阵且 x 是 R " 中的一个单位. 
向量，那么 | a *| 卜 a , 此处&是^的第一个 
奇异值. 

p . —个 mx « 矩阵 S 的奇异值分解，可以写成 
B = PLQ ,此处， P 是一个 mxm 正交矩阵， 

(3 是一个 nxn 正交矩阵， S 是一个 mxn “对 
角”矩阵. 

q . 如果 A 是 nxn 矩阵，那么 A 和 A T A 具有同样 
的奇异值. 

2. 令{叫，…， 《!„} 是 R " 的标准正交基，且入，…又是 

任何实数，定义 

A = A , h 1 h 1 t +--- + A „ h „ hJ 

a . 证明 A 是对称的. 

b . 证明人，… 又是 A 的特征值. 

3. 令4是秩为 r 的对称矩阵，试解释，为什么 

A 的谱分解是将 A 表示为 r 个秩为1的矩阵之和. 




4. 令 A 是一个 nxn 对称矩阵. 

a . 证明 （ CoM^^Nul A . (提 示：见 6.1 节 .） 

b . 证明对每一个属于『的少，可以 写成少 =; 
+ z 的形式， 其中； 属于 Col A , z 属于 NulA . 

5. 证明：如果 v 是 nxn 矩阵 A 的一个特征向量， 
且 A 是对应的 A 的非零特征值，那么 v 属于 
ColA . (提 示： 利用特征向量的定义 .） 

6. 设 A 是一个 nXn 对称矩阵，利用习题 5 和 R " 的 
-个特征向量基，给出习题 4( b ) 中分解的第二 
种证明. 

7 . 证明一个” x ” 矩阵 A 是正定的充分必要条件 
是： A 有一个楚列斯基分解， = 对一些 
可逆上三角形矩阵/?成立，其中/?的主对角元 
素都是正数.（提示 ：利用 g /? 分解和 7.2 节习 
题26 ). 

8. 利用习题7 证明： 如果 A 是正定的，那么 A 具 
有 -- 个分解 A = Lt / ，此处的对角线上有 
正主元 .（ 反之也真 .） 

如果 A 是 mxn 矩阵，那么矩阵0 =，片称为 
A 的格拉姆矩阵，在这种情形， G 的元素是 A 的 
列向量的内积. 

9- 证明： 任意矩阵 A 的格拉姆矩阵是半正定的， 
且与 A 有相同的秩.（见 6.5 节的习题 .） 

10 . 证明：如果一个 nxn 矩阵 G 是半正定且有秩 
r , 那么 G 是某 rxn 矩阵 A 的格拉姆矩阵，称 
为 G 的显秩矩阵的分解•（提示：考虑 G 的谱 
分解，首先将 G 写璃一个” xr 矩阵 5 的 55 丁 
形式 .） 

11 . 证明： 任何 ” x ” 矩阵 A 有一个形如 A = P0 的 
极分解，此处 P 是半正定矩阵且与 A 具 
有相同的秩， 2 是一个 nxn 正交矩阵.（提示： 
利用奇异值分解， A = UlV r , 且观察到 
A = ( t / St / T )( t / V T ).) 这种分解用于例如机械工 
程中给材料的变形建模.矩阵 P 表示材料（沿 
P 的特征向量的方向上）的拉伸或压缩变换， 

2表示材料在空间的旋转变换. 


习题12~14涉及一个 mxn 矩阵 A ， _! 

化的奇异值分解 ， A = U r DV r T ,且其伪逆是 
A *= V r D ' U r T . 

12. 验证 A + 的 性质： 

a . 对每个属于是在 Col A 
上的正交投影. 

b . 对每个属于 R " 的 x ，片+处是太在办界片 
上的正交投影. 

c . AA * A = Am A * AA + = A *. 

13. 若方程是相容的，且令 X + = A 3. 由 6.3 
节的习题23,存在惟一一个属于 Row A 的向 
量 P ， 使得却=*，下面的步骤证明， x * = p 
且 x + 是 Ar =6 的最小长度解. 

a . 证明： x + 属于 Row A .( 提示： 将 6 写成 
关于 x 的 Ar 形式，并且利用习题 12.) 

b . 证明： x + 是的一个解. 

c . 证明： 如果《是的任意一个解，那 
么卜1<|«|.且只有当《 =太+时等号成立. 

14. 给定 R " 中的任何*，修改习题13 证明： A + * 
是最小长度的最小二乘解.（提 示： 考虑方程 
Ar =* ,此处 S 是 J 在 Col A 的正交投影 .） 

[ M ] 对习题15和习题16构造 A 的伪逆.开始 

时使用矩阵程序计算的奇异值分解，或者，如果没 
有这个程序，首先对 A T A 进行正交对角化.使用伪 
逆求解，其中 6 = (6 ，-\ , -A , (,) ，并记 i 
是所求的解，用计算方法验证 i 属于 R 0W A ,求 
一个属于 NuM 的非零向量 a , 并验证 
W < ll ^ + «|- 由习题13 ( c ) 可知该式一定成立. 







附录 A 简化形阶梯矩阵的惟一性 


定理 （ 简化形阶梯矩阵的惟一性） 

每一个 mx « 矩阵 A 行等价于惟一简化形梯形矩阵 {/. 

证利用 4.3 节的思想，行等价矩阵的列具有完全一样的线性相关性. 

行推导的算法说明至少存在一个这样的矩阵 {/. 假设 A 行等价于简化形式的阶梯矩阵{/和 
V ， "的行 中最左边非零元素是“主元” 1,称这类主元1的位置是一个主元位置，并且包含它 
的列称为主元列，（这个定义仅用于阶梯特征的{/和 V ， 并且假设简化形式的阶梯形不惟一）. 

"和 V 的主元列恰恰是与它们左边的列线性无关的非零列，（这个条件自动满足第一列是 
非零的）.由于 "和 V 行等价，（两个矩阵都行等价于 A ), 它们的列有相同的线性相关性，因 
此，£/和 V 的主元列出现在同样位置，如果有 r 个这样的列，又因为和 V 是简化形式的阶梯 
形式，它们的主元列是 mx ” 单位矩阵的前 r 列，这样对应和 V 的主元列是相 等的. 

最后，考虑 "的任 意非主元列，例如列久这个列或者是零或者是左边主元列的线性组合 
(因为这些主元列是第_/列左边列生成空间的一个 基）. 两种情形下，对第_/个元素为1的; c 都 
可表示写成 f / x =0, 那么 也有怜 = 0, 这说明 V 的第）列或者是零或者同样是它左边 v 的主元 
列的线性组合，由于 "和 V 对应的主元列是相等的，{/和 V 的第） 列也相等，这个结果对"和 
V 所有非主元列相等，这就证明了 是惟一的. ■ 



附录 B 复 


数 


复数是可 以写成如下形式的数 


z-a + bi 

其中 a 和是实数， i 是满足关系 i 2 =- l 的常用符号，数 0 是 2 的实 部， 记作 Re z ， 数是 z 的 
虚部， 记作 Imz , 两个复数相等当且仅当它们的实部和虚部分别 相等. 例如，如果 z = 5 + (-2) i ， 
那么 Re Z = 5 且 Im z =-2， 可以简记为 z = 5-2 i . 

一个实数 a 可以认为是一个特殊类型的复数，将^和^ +以作为一个数.更进-步，实数上 
的算术运算可以扩展到复数集合上. 

复数系 是所有复数的集合，记作 C , 并具有下面加法和标量乘法运算. 

= ( 1 ) 
(a + bi)(c + d \) - (ac - bd ) + {ad + bc )\ ( 2 ) 

这些法则当 （1) 和 （2) 式中和 d 为零时，是普通实数的加法和乘法.很容易验证，在 R 
上的常见法则在 C 上同样 成立. 由于这个原因，乘法常用扩展的代数法则来 计算. 

例1 

(5 — 2 i )(3 + 4 i ) = 15 + 20 i -6 i -8 i 2 
= 15 + 14 i -8(- l ) 

= 23 + 14 i 

也就是用项 (3 + 4 i ) 乘 5-2 i 的每一项，利用 i 2 =- l ， 并将结果写成 a + W 的 形式. ■ 

复数 21 和&的减法定 义为： 

Zi -Z 2 =Zi +(-l)z 2 

特别地，我们用 - z 代替 (- l ) z . 

复数 Z = a + 的共轭复数是复数 F (读作 “ Z 棒”），定义为 
z = a - b \ 

I 可用 z 中相反的虚部符号来得到. 

例 2 -3 + 4 i 的共轭复数是 - 3-4 i ，记作 17^ U -3-4 i . ■ 

注意如果2 = 0 +况，那么 

iz — ( a -\- b \)( a - b \) = a 2 ~ ab \ + ba \- b 2 '\ 2 = a 2 + b 2 ( 3 ) 

由于三是实数且非负，它有一个平方根， z 的绝对值（或模）是实数 ui 且定义为 
I z 1= 4 zz = y / a 2 + b 2 

如果 z 是实数，那么 z = a + Oi 且它就等于平常意义下的^的绝对值. 
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下面列出一些关于共轭复数和绝对值的有用性质，设 w 和 z 表示复数. 
l.S = z 的充分必要条件是 z 是实数. 

2. w+z = w+z . 

3. ^ = 特别地，如果 r 是实数，则5 = 6. 

4. zz =\ z \ 2 ^ 0 . 

5. IwzNwllzl. 

6. Iw+zl^lwl + lzl. 

如果以 0, 那么 lzl>0 且 z 有一个乘法的倒数，记作 1/z 或 Z— 1 且给出 


当然，商 w / z 简单表示为 w .( l / z ). 

例3令 w = 3 + 4 i 和 z = 5-2 i ,计算 zllzl 和 w / z . 
解由 （3) 式 


zI = 5 2 +(-2) 2 =25 + 4 = 29 

对绝对值， \ z \= H 为计算 w / z , 首先分子和分母同乘以 i ， 即分母的共轭复数，由于 
(3) 式的性质，这个运算可消去分母中的 i . 

w _3 + 4 i _3 + 4 i 5 + 2 i _ 15 + 6 i + 20 i -8 
— 2 i _5-2 i ‘5 + 2 i — 5 2 + (-2) 2 

7 + 26 i 7 , 26. 

—- = - h - 1 ■ 


几何解释 

每一个复数 z = a + W 对应平面 K 2 上的一个点如图 B -1 所示，水平轴称为实轴，因 
为它上面的点 ( a ,0) 对应实数，垂直的轴称为虚轴，因为它上面的点 (0， fc ) 对应. 形如 0 + fci 的纯 
虚数，简记为 z 的共轭复数是 z 关于实轴的镜像， z 的绝对值是从原点到⑻的的距离 • 



图 B -1 共轭复数是一个镜像 

复数 z = a + fci 和 w = c + W 的加法对应 K 2 中 （ a , fc ) 和的向量加法，如图 B -2 所示. 
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为给出复数乘法的图形表示，我们使用 R 2 中的极坐标，给定一个非零复数 


z = + 

设炉是正实轴和点 ( fl ，&) 的夹角，如图 B -3 所示，此处 - n < 炉彡 n , 角称为 Z 的辐角，我 
们记为？ ) = argz ， 从三角函数得 

o M 2 1 cos^> b^z\s\n<p 
且 


z = a - k - bi =\ z \ (cos 炉 +i si n 炉） 



图 B -3 z 的极坐标 


如果是另一个非零复数，如 

wl ( cosiJ + isini )) 

利用关于正弦和余弦两角和的标准三角公式，可以验证 

WZ =4 ivll z l [ cos ( i )+^))+ isin ( i >+^)] ( 4 ) 

见图 B -4, 类似可以写出极坐标形式的复数除法公式，乘法和除法公式可用文字描述如 
下. 

极坐标系下，两个非零复数的乘法表示为它们绝对值的相乘和辐角相加.极坐标系下， 
两个非零复数的除法表示为它们绝对值的相除和辐角之差. _ 

例4 a . 如果 w 的绝对值为1,那么 M ^ costf + isiniJ ， 此处 I ?是 w 的辐角，对任意非零复 
数 z 乘复数 VV, 简单表示为复数 2 旋转 I? 角度. 
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Re z 

图 B -4 极坐标系中的乘法 

b . i 本身的辐角为所以，用 i 来乘复数 Z 是将 Z 旋转兰弧度，例如， 3+ i 旋转为 
2 2 

(3 + i)i = -l + 3 i . 见图 B -5. 

Im z 


Rez 

图 B -5 乘以 i ■ 

复 数的幂 

公式 （4) 中，如果 z = w = r ( cos 炉 + isin 炉），贝! J 有 
z - r 2 (cos 2 <p + i sin 2<p) 

z 3 =z-z 2 

=r (cos 炉 + i sin 炉) • r 2 (cos 2<p+i sin 2<p) 

= r 3 (cos 3 <p + i sin 3< p ) 

一般地，对任意正整数灸， 

z k = r k (cos k<p + i sin k(p) 

这个结论被称为棣莫弗定理. 

复数和 R 2 

尽管 R 2 中的元素和复平面 C 是——对应的（见图 B -6 和图 B -7), 并且加法实质上一致， 
但逻辑上 R 2 和 C 不同，在 R 2 上，我们仅能对一个向量作标量乘法，然而在 C 上，我们可以对 
任意两个复数相乘，并得到第三个复数 •（ R 2 中的点积不在考虑之内，原因是它产生一个数， 
此数不是 R 2 的元素 •） 我们用标量符号表示 C 中的元素，以强调这个区别. 






术语表 


A 

adjugate (or classical adjoint ) [伴随矩阵] 矩阵 adj A 是方阵 A 中 （ i •，力 位置的元素，用 A 中 （ i ， j ) 元素 
的代数余子式代替后，再通过转置得到的矩阵. 

affine transformation [仿射变换] 一 个形如 r (; r ) = Ac+A 的映射 r : R " ，此处 A 是/ nx ” 阵且 fc 属于 IT . 
algebraic multiplicity [代数重数] 一个特征值的重数是作为特征方程的根的重数. 
angle [ R 2 或 R 3 中非零向量和 v 之间的角度] 夹角 t ? 是指从原点到点和 v 的两个线段之间的角度， 
通过点积联系起来. 

uv = ||«| ||v||cost? 

associative law of multiplication [乘法的结合律] A ( BC ) = ( AB)C , 对所有 A , fi ， C 均 成立. 
attractor [ R 2 中一个动力系统的吸引子] 当所有轨迹都趋于0时的原点. 

augmented matrix [增广矩阵] 一个由线性方程组的系数矩阵和右边增加一列或多列的构成的矩阵，每 
一个增加的列包含给定系数矩阵对应方程组右边的常数项. 
auxiliary equation [辅助方程] 一个关于变量 r 的多项式方程，来源于齐次差分方程的系数. 

B 

back-substitution (with matrix notation ) [双矩阵做回代变换] 将阶梯形增广矩阵变换为简化形式的阶 
梯形矩阵时后一阶段的行变换，常用于求方程组的解. 
backward phase (of row reduction ) [行变换的向后阶段] 化简阶梯形矩阵为简化阶梯形矩阵算法的向 
后步骤. 

band matrix [带形矩阵]一个矩阵，它的非零元素位于主对角线的上下两侧的带形以内. 
basic variable [基本变量] 线性方程组中对应系数矩阵主元列的变量. 

basis(for a nontrivial subspace Hoi a vector space V ) [向量空间 V 中的一个非平凡子空间 H 的基] 一 

个 V 中的向量集使得 （ i ) B 是线性无关集， （ ii ) 由 B 生成的子空间和 H —致，即 
// =Span{v,, --,v,}. 

B-coordinates of x [x 的 8 坐标]见; r 相对于基 8 的坐标. 

best approximation [最佳 暹近]给定子空间中离给定向量的最近点. 

bidiagonal matrix [两对角线矩阵] 一个非零元素位于主对角线和与主对角线相邻的一斜对角线上的矩阵. 
block diagonal ( matrix ) [分块对角矩阵] 一个分块矩阵 A = [4]， 使得 !_巧 时，每一块4；；是零 矩阵. 
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block matrix [分块矩阵]见矩阵分划. 

block matrix multiplication [分块矩阵乘法]分块后矩阵的行列乘法，将块作为数来对待. 
block upper triangular ( matrix ) [上三角形分块矩阵]分块矩阵4 = [4 山使得一块4对!‘巧是零分块. 
8 -matrix (for D [关于 r 的 8- 矩阵]对 V 中关于基 B 的一个线性 变换： 7^-^对应的矩阵[7^，它 
具有如下的性质，对 V 中所有的; r ， [r(;r)] s =[ ； r] s [;r] s 成立. 


C 


Cauchy-Schwarz inequality [柯西-施瓦茨不等式]对所有 有 |< l/ ， v> |<| K ||.|| v |. 
change of basis [基的变换]见矩阵坐标变换. 

change - of-coordinates matrix (from a basis B to a basis C ) [从一个基 8 到 一个基 C 的矩阵坐标变换] 

-个矩阵^匕将 B 坐标向量变换为 CJ 坐标向量， W c = c Mar] B ,如果 C 是 IT 中的标准基’那么有时也 

将 P 记作 " 

(，卜 

characteristic equation (of /I ) [A 的特征方程] det(A - 又/) = 0. 

characteristic polynomial ( of ^) [A 的特征多项式] det(A- 又 /) 或在有些教材中， det a /- A ). 
Cholesky factorization [楚列斯基分解]一个分解 4 = 此处 / f 是一个可逆上三角形矩阵，它的所 

有对角元素为正的. ’ 

codomain (of a transformationr ： M "-> R ") [变换 r : R”->IT 的余定义域]集合 ir 包含变换 r 的值 
域.通常.如果 r 映射一个向量空间 v 到另一个向量空间你，那么 iv 被称为 r 的余定义域. 
coefficient matrix [系数矩阵]一个矩阵，它的元素是一个线性方程组的系数. 

cofactor [余 子式] -个数 Q =(- l )~ d et 4 ，称为矩阵4 ( U ) 元素的余子式，此处4是划去4中，•行和 
y 列后构成的子矩阵. 

cofactor expansion [余子式 展开] 一个计算 det 4 的公式’利用 A 的一行或一列及其对应的余子式来展 
开.如按第-一行 展开： 


detA = a u C u +--- + a ln C u 

column-row expansion [列-行展开] AB 乘积的表达式作为外积之和， 


此处《是/ I 的列数. 


… + col„(A)row„(fi) 


column space (of an mxn matrix 4 矩阵 4 的列空间] 4 所有列的线性组合的集合 Co i A ，如果 
4 = 那么 Col A=Span{fl l ,-,fl„} ,等价地有 Col A = {j>:j> = Ar, 对 R ” 中的 一些扑 

column sum [列和]一个矩阵中一列元素之和. 
column vector [列向量]只有一列的矩阵或具有几列的矩阵中的某一列 
commuting matrices [矩阵交换]两个矩阵使得 AB = BA . 

companion matrix [友 矩阵] 一 类特殊形式的矩阵，其特 征多 项式是 ( - 1 )>(； 1 ) 且〆; t) 是首项为 r 的特 
殊多项式. 


complex eigenvalue [复特征值] 一个 nx „ 矩阵特 征多项式的非实根. 




术语表 


443 


complex eigenvector [复特征向霣] C B 中的非零向量 x， 使得 Ac = ；lx， 此处 A 是一个 nxn 矩阵 ，X 
是一个复特征值. 

component of orthogonal to u (forw^O ) [y 正交于 w(w 其 0) 的分霣]向量 上上 w. 

u.u 

composition of linear transformations [线性变换的复合]由连续应用两个或更多的线性变换产生的映 
射，如果这些变换是矩阵变换，例如，左乘 S 之后接着左乘 A, 那么复合结果是映射 iHA(fir). 
condition number (ofA) [A 的条件数]商 m/a,， 此处 < 7 ,是 A 的最大特征值且是最小的特征值，如 
果 是零，条件数是 +0C. 

conformable for block multiplication [与分块乘法相一致]两个分块矩阵 A 和 S, 其分块使得乘积 AS 有 
定义，即 A 的列分块等于 S 的行分块。 

consistent linear system [相容的方程组]至少具有一个解的一个线性方程组. 
constrained optimization [条件优化]当给出 i 的一个或更多限制时，一个量的最大化问题，例如满足 
条件 xTjt = 1 或 X T V=0 ，量 jtMx 或 ||Ar|| 的最大化问题. 
consumption matrix [消费矩阵]列昂惕夫投人产出模型中的一个矩阵，它的列是经济体系中各个部门 
的单位消耗向量. 

contraction [压缩]对一些数 r 做映射 j h /x ，此处 O^r^l. 

controllable (pair of matrices) [可控制矩阵对]一个矩阵对 (A，fi)，A 是 "x" 矩阵， fi 有"行并且满足 
rank[fi AB A 2 B - = n 

相关的是控制系统中的状态空间模型和差分方程 x M =Ax k +Bu k (k = 0,\, -). 
convergent (sequence of vectors) [收敛向量序列]一个序列{&}，如果; fe 足够大，使得心中的元素 
可以接近某些固定向量中的元素. 

coordinate mapping (determined by an ordered basis B in a vector space V ) [―个向量空间的有序基 
所确定的坐标映射]一个将V中每一个 or 与它的坐标向量联系起来的映射. 
coordinates of x relative to the basis B = {A„-A} [x 相对于基 8 = ^,...A} 的坐标]适合方程 
x = c,A, + + 的系数 Ch.-. ， c„. 

coordinate vector of or relative to B [or 相对于基 8 的坐标向量]向量 [x] s ，其中的元素是; r 在基 B 下的 

坐标. 

covariance (of variables jt , and jr； , \ou*j) [变量 or,. 和变量~的协方差 y)] 对一个观测矩阵的协 
方差矩阵 S 中的元素〜，此处， or, 和 or; 分别遍历观测向量中所有，•和 y 的坐标. 
covariance matrix (or sample covariance matrix) [协方差矩阵（或样本协方差矩阵）]矩阵5， 
定义为 S = (N-iy'BB T , 此处 fi 是一个 pxw 平均偏差形式的观测矩阵. 

Cramer’s Rule [克拉默法则]当 A 是可逆矩阵时，公式给出方程组 Ac 的一个解; r 中的每个元素取值. 

cross-product term [交叉乘积项]二次型中的项 CXlXi ，其中 

D 

decoupled system [解耦系统]一个差分方程 h +1 = ，或微分方程 /(?) =办⑴，此处 A 是对角矩阵， 
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离散变化方程中 h (作为一个关于 t 的函数）的每个分量或连续变化方程中向量值函数 j>(0 的每个 
分量，当 /t->oo 或？->00时，不受其他分量变化的影响. 
design matrix [设计矩阵]在线性模型= X芦 + e 中的矩阵X，此处X的列，以某种方式由一些独立变 
量的观测值所确定. 

determinant (of a square matrix A ) [—个方阵 A 的行列式]数 det A 归纳定义为 A 的第一行余子式的 
展开.也等于 (-1/ 乘以由 A 作行变换而得到的任何阶梯矩阵 t/ 中对角元素的乘积，该阶梯矩阵是通 
过行替换和 r 次行交换得到（但没有行的倍乘变换）. 
diagonal entries (in a matrix) [一个矩阵的对角元素]元素具有相同的行下标和列下标. 
diagonalizable (matrix) [可对角化矩阵]一个矩阵可以写成分解形式 WV ，此处 D 是一个对角矩阵， 
是一个可逆矩阵. 

diagonal matrix [对角矩阵]一个方阵，不在主对角线上的所有元素为零. 

difference equation (or linear recurrence relation) [差分方程（或线性回归方程）]一个形 如;^ +1 = 
Ac^=0，l，2, …）的方程，它的解是一个向量序列， 
dilation [拉伸变换]对标量 r, 作变换; TH/x, 其中 r>l. 

dimension (of a vector space V) [向量空间 V 的维数]V的一个基中向量的个数，记作 dim V,零空间 
的维数为零. 

discrete linear dynamical system [离散线性动力系统]一个形如 心 +1 = 的差分方程，描述随时间演 

变的系统变化（常指物理系统），物理系统用离散时刻来度量，当 /fe=0，l,2，...， 且系统在时刻 t 时的状 
态是一个向量，其元素给出所感兴趣的事实. 
distance between u and v [w 和 v 之间的距离]向量 u-v 的长度，记作 dist(n，v). 
distance to a subspace [到一个子空间的距离]从一个给定点 （ 向量） v 到一个子空间的最近点的距离. 
distributive laws [分配律]对所有 A，fi，C， （左） A(fi + C) = Afl +AC 和（右） （fi + C)A = SA + CA 
domain (of a transformation T) [变换 r 的定义域] r ⑴有定义的向量的集合. 
dot product [点积]见内积. 

dynamical system [动力系统]见离散线性动力系统. 

E 

echelon form (or row echelon form,of a matrix) [矩阵的阶梯形式（或行阶梯形式）]一个阶梯矩阵行 
等价于给定矩阵. 

echelon matrix (or row echelon matrix) [阶梯矩阵（或行阶梯矩阵）]一个长方形的矩阵具有三个特 
性： （ 丨 ） 所有非零行位于所有零行的上方， （2) 每一个一行中的主元素所在列处于上行主元素所在 
列的右边. （3) 在主元素之下的所有同一列的元素是零. 
eigenfunctions (of a differential equation x\t) = Ax(t) ) [—个微分方程 x\t) = Ax(t) 的特征 函数]一个函 
数 or ⑴此处 •"是 A 的特征向量且;I是对应的特征值. 
eigenspace (of A corresponding to A) [矩阵 A 对应; l 的特征子空间] Ar = ；U 所有解的集合，它包含零 
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向量和所有对应又的特征向量，此处又是 A 的一个特征值. 
eigenvalue (of A ) [ A 的特征值]一个数； I ，使得方程 Ac =； U 有一个非零向量解; r . 
eigenvector (of A ) [ A 的特征向量]一个非零向量厂使得 Ac = ； b ： 对一些数； t 成立. 
eigenvector basis [特征向量基]包含给定矩阵的全部特征向量的基. 

eigenvector decomposition (of or) [or 的特征向量分解]一个方程 ，： r = c , v , + ... + c , Vn ,表示 ; r 作为矩阵 
特征向量的线性组合. 

elementary matrix [初等矩阵]一个可逆矩阵，它是对单位矩阵作一次基本行变换得到的矩阵. 
elementary row operations [初等行变换] ( 丨 ）（ 替换）用自己所在行与其他行的倍数之和替换一行 .（ 2 ) 
交换两行. （ 3 )( 倍乘）用非零数乘某行的所有元素. 
equal vectors [相等向量] KT 中对应的元素相同的向量. 

equilibrium prices [平衡价格]经济体系中各个部门总支出的价格集合，使得每个部门的总收人与总支 
出正好均衡. 

equilibrium vector [平衡向量]见稳态向量. 

equivalent ( linear ) systems [等价的线性系统]具有同样解集的线性系统. 
exchange model [交换横型]见列昂惕夫交换檨型. 

existence question [存在性问题]“一个系统的解是否存在？，’， 即 “系统是否相 容？” ，也是 “ 对所有 
A , At =6的一个解是否存 在？” 
expansion by cofactors [用余子式展开]见余子式展开. 

explicit description (of a subspace IVofR ") [显式描述 IT 中一个子空间則用参数表示砍，它是— 
个特殊向量集合的所有线性组合的全体. ’ 

F 

factorization ( of /1) U 的分解]将4表示为两个或更多矩阵乘积的一个方程. 
final demand vector (or bill of final demands ) [最终需求向量 （或 最终需求的清 单 ）] Leontief 投人_ 
产出模型中的向量 rf ， 列出部分经济体系中非生产性的各部门货物和服务的价值向量可以表示消 
费者需求、政府消费、生产者剩余、出口或外部需求. 
finite-dimensional (vector space ) [有限维向量空间]—个由有限个向量的集合所生成的向量空间 
flexibility matrix [弹性矩阵]一个矩阵，当单位大小的力作用在梁的第 ; •个点时，它的第 y 列给出该弹性 
梁在特定点处的弯曲. 

floating point arithmetic [浮点算术运算]数字用十进制 ±0扁…冬 xl( r 表示，此处；•是一个整数且表示 
小数点右边的位字，数 p 常常位于8和16之间. 
flop [浮运算]两个实浮点数的一次算术运算 （+ ，_，*， " 

forward phase (of row reduction ) [行简化的向前阶段]简化一个矩阵为阶梯矩阵的第一部分算法 
Fourier approximation (of order n ) [« 阶傅里叶暹近]在„阶三角多项式子空间中，与空间 c[0 2lt] 中 
给定函数的距离最近的点. ’ 
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Fourier coefficients [傅里叶系数]在傅里叶逼近一个函数中，三角多项式的系数. 

Fourier series [傅里叶级数]一个无穷级数，在内积空间 C[0,2ji ] 内收敛于一个函数，其内积由一个定 
积分确定. 

free variable [自由变量]一个线性方程组中不是基本变量的任意变量. 

full rank (matrix) [满秩矩阵]一个 mxn 矩阵，它的秩等于 m 和 n 的最小值. 

fundamental set of solutions [基础解系]齐次线性方程或齐次微分方程所有解构成的集合的一个基. 

fundamental subspaces (determined by A) [A 的基础子空间] A 的零空间和 A 的列空间以及 A T 的零 
空间和 A T 的列空间， Col A T 常称为 A 的行空间. 

G 

Gaussian elimination [高斯消元]见行化简方法. 

general least-squares problem [—般的最小二乘问题]给定一个 mxn 矩阵 A 和一个属于] R™ 的向量 A, 
求属于 R" 的 f ,使得 Af||0-At|| 对所有 R" 中的; r 成立. 

general solution (of a linear system) [—个线性方程组的通解]参数表示的解集合，它用任意参数形 
式的自由变量表示基本变量，在 1.5 节之后，参数表示被写成向量形式. 

Givens rotation [吉温斯旋转]计算机中使用的从 R" 到 R” 的线性变换，其作用是产生一个向量（常指 
矩阵的一列）中的零元素. 

Gram matrix (of A) [矩阵 A 的格拉姆矩阵]矩阵 A T A. 

Gram-Schmidt process [格拉姆-施密特方法]对生成子空间的给定向量集合，生成正交或单位正交基 
的一个算法. 

H 

homogeneous coordinates [齐次坐标]在 M 3 中，对任何将 （ x ,； y , z ) 表示为 （X,y,Z，H) ，此处 
= = 在 r 2 中，//常取作 1, (x，>o 的齐次坐标常写成 (x, y ,i). 

homogeneous equation [齐次方程]一个形如 Ax = 0 的方程，可能写成是一个向量方程或一个线性方程组. 

Householder reflection [豪斯翟尔德镜像]一个变换 xh^Qx ,*^<2 = /- 2kk t 且 u 是一个单位向量 (k t h = 1). 


identity matrix (denoted by/or/„) [单位矩阵（记作 / 或 /„)] 一 个对角线上为1、其他元素为0的方阵. 
ill-conditioned matrix [病态矩阵]一个具有大的 （ 或者无穷大）条件数的 矩阵； 如果矩阵中的一些元素 
改变一点，矩阵是奇异矩阵或会变成奇异矩阵. 

image (of a vectors under a transformation T ) [—个向量在一个变换 r 下的像]用 r 指定给 x 的向量 r(；r). 
implicit description (of a subspace W of R" ) [ R" 的一个子空间 IV 的隐式描述]一个或多个齐次方程 
的解集合描述你中点的特性. 
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\mx [: r 的虚部]由 C" 中向量; r 的虚部元素所形成的 IT 中的向量. 
inconsistent linear system [不相容线性方程组]一个没有解的线性方程组. 
indefinite matrix [不定矩阵]一个对称矩阵 A， 使得的值既有正值又有负值. 
indefinite quadratic form [不定二次型]一个二次型2，使得 2(>r) 既有正值又有负值. 
infinite-dimensional (vector space) [无限维向量空间]一个非零向量空间V没有有限基. 
inner product [内积]数量 u T v, 常写成 m.v ，此处 m 和 v 是 IT 中的向量，作为 nxl 矩阵，也称为 w 和 
的点积.一般地，一个向量空间中的函数，给出每一对向量 b 和 •> 对应的一个数<«, •>>，它满足 
一些公理，见 6.7 节. 

inner product space [内积空间]一个已定义了内积的向量空间. 
input-output matrix [投入产出矩阵]见消费矩阵. 
input-output model [投入产出檨型]见列昂惕夫投入产出檨型. 

intermediate demands [中间需求]对货物或服务的需求会被消耗在其他货物生产过程中或顾客的服务 
中，如果1是生产水平且 C 是消费矩阵，那么 Cr 列出中间需求. 
interpolating polynomial [插值多项式]一个多项式，其图像通过 R 2 中的一个点集的每一个点. 
invariant subspace (for A ) [A 的不变子空间]一个子空间//，使得当 ore// 时， Ar 仍然属于 
inverse (of an«xnmatrix A ) [—个 nxn 矩阵 A 的逆]一个 nxn 矩阵 A— 1 使得 A4— 1 = A _1 A = /„ _ 
inverse power method [逆幕法]当具有 A 的一个好的初始估计时，一个估计方阵特征值 A 的算法. 
invertible linear transformation [可逆线性变换]一个线性变换 ->R” ，使得存在一个函数 
5:R" ->»" 对所有 ,满足 T(S(x)) = jt 和 S(T(x)) = x . 

invertible matrix [可逆的矩阵]一个具有逆阵的方阵. 

isomorphic vector spaces [同构向量空间]两个向量空间V和砍，且存在一个一对一线性变换 r, 将V 
映上到你. 

isomorphism [同构]从一个向量空间到另一个向量空间的一个一对一线性映射. 

K 

kernel (of a linear transformation T：V ) [―个线性变换 r:v ->砍的核] V 中满足 r(；r)：=0 的所 
有 1 的集合. 

Kirchhoff's Laws [基尔翟夫定律] (1)( 电压定律）环路中一个方向上的电压降 W 的代数和等于环路 
中同一方向电源电压的代数之和 .（2)( 电流定律）一个分支中的电流是流向该分支环路电流的代数和. 


L 

ladder network [梯形网络]一个由两个或更多电路串联而成的电路网络. 
leading entry [首项元素]一个矩阵一行中最左边的非零元素. 

least-squares error [最小二乘误差]从* 到沿 的距离||*-沿||,其中 f 是 Ar =* 的一个最小二乘解. 
least-squares line [最小二乘直线]直线 >> =戌,使得方程 = + e 的最小二乘误差达到最小. 
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least-squares solution (of Ax=b ) [方程 Ac = 办的最小二乘解]一个向量无使得对所有属于『的 x 有 
||*-Ar||^||*-Ar|| 

left inverse (of A) [A 的左逆]任何矩形矩阵 C 使得 CA = /. 
left-multiplication (by A) [用 A 左乘]用 A 左乘一个向量或一个矩阵. 
left singular vectors (of A) [A 的左奇异向量]在奇异值分解 A = t/2：V T 中的 t/ 的列. 
length (or norm of v ) 0 的长度或范数]数 || v | = Vi ^ =」( v ， v ). 

Leontief exchange (or closed) model [列昂惕夫交换（或封闭）檨型]经济体系中的一个投人和产出 
都固定的模型，且部门产出的一组价格，要求满足每个部门的收人等于该部门的支出.这个“平衡” 
条件表示为一个价格未知的线性方程组. 

Leontief input-output model (or Leontief production equation) [列昂惕夫投入产出檨型（或列昂惕夫产 

量方程）]方程; r = a : +rf, 其中; r 是产量， rf 是最终需求， C 是消费（或投人产出）矩阵. C 的第 
„/列给出该部门第 j 个顾客每单位产出的投人. 
linear combination [线性组合]向量标量乘法之和，其中标量称为权值. 

linear dependence relation [线性相关关系]一个齐次向量方程具有特殊的权值系数，且至少一个权值 
不为零. 

linear equation ( in the variables ) [变量 々，…，〜 的线性方程] 一个可以写成形如 

+fl 2 JC 2 + … + 的方程，此处 fc 和系数 a , 是实或复数. 

linear filter [线性滤波]一个线性差分方程用于变换离散时间信号. 

linearly dependent (vectors) [线性相关向量]带标号向量的集合 {v,,..., 具有性质，存在不全为零的 
权值 Ci,---,C p ,使得 QV, + ■■■ + C p V p = 0. 即向量方程 Cih +C 2 V 2 + …+ <7,1^ =0有一组非零解. 
linearly independent (vectors) [线性无关向量] 带标号向量的集合具有性质，向量方程 
£•,!>,+ C 2 V 2 + …+ c'p = 0只有平凡解 c,= - = c p =0. 

linear model (in statistics) [统计中的线性檨型] 任何形如 = + e 的方程，此处尤和,是已知的， 

芦的选取，使得剩余向量 e 的长度最小. 

linear system [线性系统]一个或多个包含同样变量如 x u ...， x „ 的线性方程集合. 
linear transformation T (from a vector space V into a vector space W ) [从向量空间 V 到向量空间 IV 的 
线性变换 r] 一 个法则 r 指定 v 中任一向量1对应 iv 中惟一向量 r(；r) ，使得 （i) 对任意 v 中的向 
tu , v ,有 r(K + i>) = ;r( K ) + r(i >). 且 （ ii ) 对 v 中所有向量 K 和所有数 c , 有 r(aO = c r( H ). 记号： 
t -. v^w ；当和 a 是 r 的标准矩阵时，也可表示为; thAc . 
line through p parallel to v [通过 p 且平行 v 的直线]集合 {p + f e R}. 

loop current [闭路电流]流过一个回路电流的总和，使得回路中 W 电压降的代数和等于回路中电源电 
压的代数和. 

lower triangular matrix [下三角形矩阵]一个对角线以上的元素全为零的矩阵. 

lower triangular part (of A) [A 的下三角形部分]一个下三角形矩阵，它的位于主对角线和对角线以下 
的元素与 A 中同样位置的元素相同. 

LU factorization [LU 分解]一个矩阵 A 形如 A = LU 的表示，此处 L 是对角线上元素为1的下三角形方 
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阵（一个单位下三角形矩阵）， i/ 是 A 的一个阶梯矩阵. 

M 

magnitude (of a vector) [—个向置的长度]见 范数. 

main diagonal (of a matrix) [—个矩阵的主对角线]具有相同行下标和列下标的元素. 
mapping [映射]见变换. 

Markov chain [马尔可夫链]一个概率向量序列;，…连同随机矩阵 P , 使得; ^,=作 4 对任意 
i =0,1,2,...，成立. 
matrix [矩阵]一个矩形数组. 

matrix equation [矩阵方程]一个至少包含一个矩阵的方程，例如 ， Ax = b . 

matrix for T relative to bases B and C [相对于基 B 和基 C 的矩阵 r ] 对一个线性变换 r:V 的矩阵 
M, 具有性质，对任何属于V的 JC, 有 [r(x)] c =M[;c] s ，此处 B 是V的基， C 是IV 的基.当 = l /和 C = B 
时，矩阵 M 被称为 r 的 b 矩阵，且记为 [r] s . 

matrix of observations [观测矩阵]一个矩阵，它的列是观测向量，每一列给出一个特定总体或集 
合中的个体或对象的 P 个测量值. 

matrix transformation [矩阵变换]一个映射 jc Ac ，此处 A 是一个 mxn 矩阵，表示 IT 中的任意向 
量. 

maximal linearly independent set (in K) O 中最大的线性无关集]V中一个线性无关集合使得属于 
V,但不属于 B 的一个向量V添加到 B 中，则新集合是线性相关的. 
mean-deviation form (of a matrix of observations) [—个观测矩阵的平均偏差形式]一个矩阵，它的 
行向量是平均偏差形式，任一行元素之和为零. 
mean-deviation form (of a vector) [—个向置的平均偏差形式]一个元素之和为零的向量. 
mean square error [均方误差]内积空间中一个逼近的误差，此处的内积由定积分来定义. 
migration matrix [迁移矩阵]一个矩阵给出不同位置间从一个阶段到下一阶段移动的百分比. 
minimal spanning set( for a subspace H) [―个子空间 H 的最小生成集]集合 B 生成 H 并且具有性质， 
如果 B 中的任一元素从 B 中去掉，则新的集合不能生成 
mxn matrix [ mxn 矩阵]一个具有 m 行和 n 列的矩阵. 

Moore-Penrose inverse [穆尔-彭罗斯逆]见伪逆. 

multiple regression [多元回归]一个线性模型包含多个线性无关变量和一个相关变量. 

N 

nearly singular matrix [几乎奇异矩阵]一个病态矩阵. 

negative definite matrix [负定矩阵]一个对称矩阵 A ， 使得对所有有 ; cMx<0 成立. 
negative definite quadratic form [负定二次型]一个二次型2,使得对所有 有 2(；c)<0 成立. 

negative semidefinite matrix [半负定矩阵]一个对称矩阵 A ， 使得对所有有成立. 
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negative semidefinite quadratic form [半负定二次型]一个二次型2，使得对所有太，2(太）<0成立. 
nonhomogeneous equation [非齐次方程] 一 个形如 Ar =6且的方程，也可以表 tk 一个向量方程或 
一个线性方程组. 

nonsingular (matrix) [非奇异矩阵] 一 个可逆矩阵. 

nontrivial solution [非平凡解]齐次方程或齐次线性方程组的一个非零解. 

nonzero (matrix or vector) [非零（矩阵或向置）]一个矩阵（可能仅有一行或仅有一列）包含至少一 

个非零元素. 

norm (or length of v) [v 的范数或长度]标量 ||v| = Vv~T = yl ( v - v ). 

normal equations [标准方程]表示为 A T Ax = A T b 的方程，它的解给出 Ax = b 的所有最小二乘解. 
在统计学中，常见的记号是 = 

normalizing (a nonzero vector v) [一个非零向置的单位化]用 v 的正倍数得到一个单位向量 w 的过程. 
null space(of an mxn matrixA) [—个 mxn 矩阵 A 的零空间]齐次方程 Ar = 0 的所有解的集合 Nul A. 
Nul 4 = {x:x 属于 IT 且 Ar = 0}. 


o 

observation vector [观测向置]线性模型 j +e 中的向量 j ，此处 j 的元素是因变量的观测值. 

one-to-one (mapping) [一对一映射] 一 个映射 r:IT ，使得 R" 1 中的每一个是 R” 中最多一个元 

素 x 的像. 

onto (mapping ) [映上映射]—个映射使得 ST 中的每一个元素是 IT 中至少一个元素 x 的像. 

origin [原点]零向量. 

orthogonal basis [正交基]一个基，它也是一个正交集合. 

orthogonal complement (of W ) [灰的正交补]与 灰中所 有向量都正交的集合 . 

orthogonal decomposition [IE 交分解]一个向量 j 表示为两向量之和，一个向量在特定的子空间灰中， 
另一向量在空间—般地，分解 y = 0,1^十…+〜!^，这里{叫 ，…， 是包含 y 的子空间的一个正 
交基. 

orthogonally diagonalizable (matrix) [可正交对角化矩阵]矩阵 A 有一个分解 A = 尸/^厂 1 ，其中尸是正 
交矩阵 （广 1 = P T ) 且 £) 是对角矩阵. 

orthogonal matrix [正交矩阵]一个可逆方阵 t /， 使得 = 

orthogonal projection ofy onto w (or onto the line through u and the origin, forw 关0 ) [j 在 w 上的正交 
投影（或在通过“和原点的直线上的投影，其中《#0) ] 向量$定义为 i=Mu. 

II II 

orthogonal projection of y onto 灰 [j 在 灰上 的正交投影]灰中的惟一向量 f ，使得^与灰正交， 
i 己号 y = pro] w y . 

orthogonal set [正交集]向量的集合，使得对中的不同向量 u，v ，有 w.v=0 成立. 

orthogonal to 灰[与 VV 正交]与 灰中任 一向量正交. 

orthonormal basis [单位正交基]一个由单位正交向量集合构成的基. 
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orthonormal set [单位正交集]一个由单位向量构成的正交集合 • 

outer product [外积]一个矩阵乘积 u» T , 此处“和 v 是 IT 中作为 nxl 矩阵的向量•（转置符号在符号“ 
和 k 的“外侧”）. 

overdetermined system [超定方程组]一个线性方程组中，方程的个数多于未知变量的个数. 

P 


parallelogram rule for addition [加法的平行四边形法则]两个向量 u 和 v 之和是 u,v 和0确定的平行四 
边形的对角线的几何解释. 

parameter vector [参数向置]线性模型= XjS+e 中的未知向量卢 . 

parametric equation of a line [—条直线的参数方程]一个形如; c = p + /v ( f 属于 R ) 的 方程. 
parametric equation of a plane [—个平面的参数方程]一个形如; c = p + «i + /v ( 以属于 R ) 的方程， 

其中“和 v 是线性无关的向量. 

partitioned matrix (of block matrix) [矩阵分划（或分块矩阵）]一个矩阵，它的元素本身是适当大小 
的矩阵. 

permuted lower triangular matrix [置换下三角形矩阵]一个矩阵，通过行置换后构成一个下三角形矩阵. 
permuted LU factorization [置换 Lt； 分解]一个形如 A ^ LU 的矩阵分解表示，此处 L 是一个行置换后 
形成的单位下 H 角形方阵，[/是 A 的一个阶梯形矩阵. 
pivot [主元]一个非零数，或者在主元位置通过行变换用于生成零，或者变成主项为1，再用于生成零. 
pivot column [主元列]一个包含主元位置的列. 
pivot position [主元位置]矩阵 A 的阶梯矩阵的主元元素所在的位置. 

plane through u,v and the origin [过 “，v 和原点的平面]一个形如; c = «i + /v ( 以属于 K ) 的矩阵 
方程集合，此处 u 和》线性无关. 

polar decomposition (of A) [矩阵 A 的极分解]一个分解4 =叩，此处 P 是一个 n x n 半正定矩阵且与 
A 的秩相同， （2 是一个 nxn 正交矩阵. 

positive definite matrix [正定矩阵]一个对称矩阵 A， 使得对所有 jc t Ac >0 成立. 
positive definite quadratic form [正定二次型]一个二次型 g， 使得对所有; c *0， G ⑷ >0. 
positive semidefinite matrix [半正定矩阵]一个对称矩阵使得对所有; c, 成立. 

positive semidefinite quadratic form [半正定二次型]一个二次型!2，使得对所有; c*0, Q ( x )^0. 
power method [幕算法]估计一个方阵严格占优特征值的一个算法. 

principal axes (of a quadratic form x T Ax ) [—个二次型的主轴]正交矩阵 P 的单位正交列（这 
些列是 A 的单位特征向量），使得是对角阵.通常 P 的列按 A 的对应特征值大小的递减顺序来 
排序. 

principal components (of the data in a matrix B of observations) [观测矩阵 fl 中数据的主成分] B 的 
样本协方差矩阵 S 的单位特征向量，其特征向量以对应 S 特征值的递减顺序来 排列. 如果是平均偏 
差形式，那么主成分分量是 fl T 奇异值分解中的右奇异向量. 
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probability vector [概率向置]一个 R" 中的向量，它的元素非负且和为 1. 
product Ac [乘积 Ac] A 中列的线性组合，利用; c 的对应元素作为权值. 

production vector [生产向置]列昂惕夫投人产出模型中的向量，它列出一个经济体系中各部门将要生 
产的数量. 

projection matrix (or orthogonal projection matrix) [投影矩阵或正交投影矩阵]一个对称矩阵 fl， 使 
得 B 2 = B ， 一个简单例子 = 此处》是一个单位向量. 
proper subspace [真子空间]向量空间V中，任何一个不是自己本身的子空间. 
pseudoinverse (of A) [A 的伪逆]矩阵当 W3V t 是 A 的一个简化奇异值分解. 

Q 

quadratic form [二次型]一个定义在 R" 上的函数2(岣=/如，此处 A 是一个 nxn 对称矩阵（称为二 
次型的矩阵）. 

QR factorization [郎分解]一个 mxn 矩阵 A 的分解，其中 A 具有线性无关的列 ， a = QR ,此处 G 是 
一个 mxn 矩阵，它的列构成 Col A 的一个单位正交基， /f 是一个 nxn 上三角形可逆矩阵，它的对角 
线是正元素. , 

R 

range (of a linear transformation T ) [— 个线性变换 r 的值域]对于变换 r 定义域中所有厂构成形如 
r (幻 的所有向量的集合. 

rank (of a matrix A) [矩阵 A 的秩] A 的列空间的维数，记为 rank A. 

Rayleigh quotient [瑞利商] = ，矩阵 a 的一个特征值估计 （A 常为对称矩阵）. 

recurrence relation [递推关系]见差分方程. 

reduced echelon form (or reduced row echelon form) [简化的阶梯形式（或简化的行阶梯形式）] 一 

个行等价于给定矩阵的简化阶梯矩阵. 

reduced echelon matrix [简化的阶梯矩阵]一个阶梯形式的矩形矩阵具有下列附加性质：每一非零行的 
主元素为1，每一主元素1是它所在列的惟一非零 元素. 
reduced singular value decomposition [简化的奇异值分解]对秩为 r 的 mxn 矩阵的一个分解 
A = UDV T ,此处 [/ 是具有单位正交列的矩阵， £) 是一个 rxr 对角矩阵，且 D 的对角线上有 
个非零奇异值，V是一个具有单位正交列的 n xr 矩阵. 
regression coefficients [回归系数]最小二乘直线 y = +知中的系数凡和饵. 

regular stochastic matrix [正则随机矩阵]一个随机矩阵 p ,使得一些矩阵幂尸仅包含严格正元素. 
relative change or relative error(in 6)[6 中的相对改变或相对误差]数量|灿,|，其中*改变为* + A*. 
repellor (of a dynamical system in K 2 ) [R 2 动力系统的排斥子]当所有轨迹 （ 除常零序列或常零函 
数外）都远离0时的原点. 
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residual vector [残余向置]一般线性模型 _y = X/J+e 中出现的量 e , UVe ^ y - Xfi , 关于 y 的观测值和 
预测值之间的差. 

Re x [实部] IT 中的向量，它由 C" 中的一个向量; c 的元素实部所构成. 
right inverse (of A) [A 的右逆]任何矩形矩阵 c, 使得 AC = /. 
right-multiplication (by A) [用 A 右乘]用 A 右乘一个矩阵. 
right singular vectors (of A) [A 的右奇异向置]在奇异分解 A = [/EV T 中，V 的列. 
roundoff error [舍入误差]计算结果被舍人 （ 或截断）到数字的浮点数字存储位数所引起的浮点算术误 
差.也就是说，一个数（如 1/3) 用十进制小数表示为具有有限位数字的浮点数近似结果所产生的误差. 
row-column rule [行列法则]计算乘积 Afl 的法则， Afl 中（/，_/)位置的元素是 A 的第 z •行与 fl 的第_/列对 
应元素乘积之和. 

row equivalent (matrices) [行等价矩阵]两个矩阵通过有限行变换，使得一个矩阵变为另一个矩阵. 
row reduction algorithm [行化简算法]一个系统方法，它利用基本行变换将一个矩阵化简为阶梯形式或 
简化的阶梯形式. 

row replacement [行替换]一个基本行变换，它将矩阵的一行替换为本行与另一行标量乘法后的和. 
row space (of a matrix A) [一个矩阵 A 的行空间]由 A 的行向量的所有线性组合形成的集合 Row A ， 
同样记作 Col A t . 

row sum [行和]一个矩阵中，一行元素的和. 

row vector [行向置]只有一行的矩阵，或具有几个行的矩阵中的某一行. 

row-vector rule for computing Ax [计算乘积 Ac 的行向置法则]其中 Ac 的第；个分量是 A 的第/行和 
向量; c 的对应元素乘积之和. 

S 

saddle point (of a dynamical system inK 2 ) [R 2 中动力系统的鞍点]当一些轨迹被吸引到0,另外一 

些轨迹排斥出0时的原点. 

same direction (as a vector v) [与向置 v 同一方向]用正数乘向量 v 得到的向量. 
sample mean [样本均值]一个向量集合 X '，…， 的平均 M 表示为 
M = (1/ao(X 々 .. + D 

scalar [标置]一个实数，常用于乘一个向量或者一个矩阵. 

scalar multiple of “ by c [用标置 c 乘 《] 向量 c „ 是用标量 c 乘„的每一个分量元素来确定的. 
scale (a vector) [一个向置的度置]用一个非零数乘一个向量（或一个矩阵的一行或者一列）. 

Schur complement [舒尔补]一些由一个 2x2 分块矩阵 a = [4 ? ] 所形成的矩阵.如果 A„ 可逆，它的舒尔 
补是 A 22 -A 2 ,AV4 2 .如果4可逆，它的舒尔补是4,-^%,. 

Schur factorization (of A,for real scalars) [实数矩阵 A 的舒尔分解]具有 n 个实特征值的 nxn 矩阵 A 
的一个分解 A = Wf[/ T ，此处 [/ 是一个 nxn 正交矩阵，且 /f 是一个上三角形矩阵. 
set spanned byfw.Al [由 {v,，".，v P l 所生成的集合]集合 Span 比， . 
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signal (or discrete-time signal) [倌号（或离敝时间倌号）]一个两边无穷的数列 ，⑹； 一个定义在 
整数范围内的函数；它属于向量空间 §. 

similar (matrices) [相似矩阵]矩阵 A 和5,存在可逆阵 P ， 使得3或/1 =仲广成立 • 
similarity transformation [相似变换]一个变换将 A 变为 P _1 AP . 
singular (matrix) [奇异矩阵]没有逆的一个方阵. 

singular value decomposition (of an mxn matrix A) [ —个 mxn 矩阵 A 的奇异值分解] A=UXV T , 
此处是一个 mxm 正交矩阵，V是一个正交矩阵，£是一个 mx n 矩阵且非零元素位于主对角 
线上 （ 大小以递减顺序排列），零位于其他 位置. 如果 rank A = r ，那么£恰好具有/•个正元素 （A 的 
非零奇异值）在其对角线上. 

singular values (of [々的奇异值]矩阵特征值的正的平方根，其大小按递减顺序排列- 

size (of a matrix) [矩阵的大小]写成 mxn 的形式的两个数，给出一个矩阵中行的数目 m 和列的数目 


solution(of a linear system involving variables ) [关于变置的线性方程组的解] 一列 

数(〜&…不)使得当值分别代替 x,, …, x, 后，线性方程组中每一个方程都成立 • 
solution set [解集]线性方程所有解的集合. 

Span {v,, -,v P l [卜,，…, M 所生成的子空间]的所有线性组合的集合，也是由所生成（或 
张成）的子空间. 

spanning set (for a subspace H ) [—个子空间 // 的生成集] H 中的任何集合使得 
H=Span{v lt --.v,}. 

spectral decomposition (of A) [A 的谱分解]表达式 A =々iMir + … + • 此处， {“,，•••，“„}* A 的特 

征向量的一个单位正交基，且人,...,；1„是4的对应特征值. 
spiral point (of a dynamical system in R 2 ) [R 2 中动力系统的蠼线极点]当轨迹绕0螺旋时的 原点. 
stage-matrix model [分级矩阵横型]一个差分方程 jrw =先^ ,此处 A 列出时间 （时， 全体人口中女性的 
数目，其中女性根据不同发展阶段来分类（如青少年、接近成年、成年）. 
standard basis [标准基] 由单位矩阵的列所构成的『的基，或 P, 的基 
standard matrix (for a linear transformation D [—个线性变换 r 的标准矩阵]矩阵 A 使得 r(;c) = Ac ， 
对 r 的定义域中所有; c 成立. 

standard position [标准位置]当 A 是一个对角矩阵时，方程 jr T Ac = c 的图形所处的 位置. 
state vector [状态向置]一个概率向量，一般地，一个向量表示一个物理系统的“状态”，常常与一个 
差分方程: c t+1 =Ac t 联系在一起. 

steady-state vector (for a stochastic matrix P) [—个随机矩阵 P 的稳态向量]存在一个概率向量？使 

得= 9成立. 

stiffness matrix [刚性矩阵]一个弹性矩阵的逆，刚性矩阵的第 j 列给出相应的负载施加于一个弹性梁的 
特定点，使得在梁的第 j 点产生一个单位弯曲. 
stochastic matrix [随机矩阵]一个方阵，其列是随机向量. 

strictly dominant eigenvalue [严格占优特征值（主特征值）]矩阵 A 的一个特征根人 ， 对所有 A 的其 
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他特征值;1«具有性质叫>叫|. 

submatrix (of A) [A 的子矩阵]任何由划去 A 的一些行和 A 的一些列所得到的矩阵， A 自身也是. 
subspace [子空间]由V中一些向量构成的子集//,使得 H 具有 性质： （ 1 ) V中的零向量在// 中； （ 2) 
//对向量加法 封闭； （3) H 对标量乘法封闭. 
symmetric matrix [对称矩阵]一个矩阵使得 A T = A. 

system of linear equations (or a linear system) [线性方程组或一个线性系统]一个或多个与相同变量 
集如X,,…，有关的线性方程的集合. 


total variance [方差总和]一个观测矩阵的协方差矩阵的迹. 
trace (of a square matrix A) [— 个方阵 A 的迹] A 中对角线元素之和，记为 trA. 
trajectory [轨迹]一个动力系统 jr t+l = /1^解的图像{和,;^，;^，…}.常与一条曲线联系起来，使得轨迹容 
易观察.也是 f》0 时， jc(f) 的图像，其中 ;c(f) 是微分方程〆 (f) = Ac(f) 的解. 
transfer matrix [转换矩阵]与一个电路有关的矩阵，具有输人和输出端，使得输出向量是 A 与输人向 
量乘积. 

transformation (or function or mapping) T from R" to R m [从 R" 到 R" 的变换 r (或函数、映射）]一 
个法则，它指定 R" •中每一个向量; C 对应 R m 中惟一的向量 r(jc). 记号： T : R n ^ R m ,也是 
表示一个法则，它指定 v 中一个对应IV中惟一的向量 ru). 
translation (by a vectorp) [平移一个向置 p 的变换]一个向量加 p 后的变换，或对给定集合中任一向 
量加 P 的变换. 

transpose (of A) [A 的转置]一个 nxm 矩阵 A T , 它的列对应 mxn 矩阵 A 的行. 
trend analysis [趋势分析]通过计算在有限点集处的内积，用正交多项式拟合数据. 
triangle inequality [三角不等式]对所有“和 v, |“ + v|<|u|+|v| 成立. 

triangular matrix [三角矩阵]一个矩阵或者对角线上方的元素为0,或者对角线下方的元素为 0. 
trigonometric polynomial [三角多项式]由常数函数1和正弦函数和余弦函数，例如 cosnf 和 sinnf 的线 
性组合所构成. 

trivial solution [平凡解]齐次线性方程组 Ac = 0的解， j： = 0. 

U 

uncorrelated variables [不相关变置]任意两个变量和七(;# 力， 它们取遍一个观测矩阵中观测向量 
的；坐标和 j 坐标，且协 方差& 是零. 

underdetermined system [不确定系统]方程个数少于未知数个数的线性方程组. 
uniqueness question [惟一性问題]“方程组是否有解？它的解是否惟一？即只有一个解吗？” 
unit consumption vector [单位消费向置]列昂惕夫投人产出模型中的列向量，它给出每一单位的输出 
所需的每一个部门的 输人； 是消费矩阵的一个列. 
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unit lower triangular matrix [单位下三角形矩阵]一个下三角形方阵，其主对角线上的元素是 1. 
unit vector [单位向置]一个满足||»|| = 1的向量 v . 

upper triangular matrix [上三角形矩阵]一个矩阵(不一定方阵），其零元素位于对角线上元素 

之下方. 


V 


Vandermonde matrix [范德蒙德矩阵]一个矩阵 V 或它的转置， V 的形式是 

V = 11又 2 又 2 2 … ’丨 


L 1 ' kJ 

variance (of a variable 々 ） [—个变置乃的方差]一个观测矩阵的协方差矩阵 s 的对角线上元素心， 
此处巧取遍观测向量的）个坐标. 

vector [向置]一 列数； 只有一列的矩阵，一般指一个向量空间中的任一元素 • 


vector addition [向置加法]通过对应元素相加得到向量相加. 


vector equation [向置方程]含未知权值的向量线性组合所得到的方程. 

vector space [向置空间]以向量为对象所形成的集合，且定义被称为加法和标量乘法的两种运算，必 
须满足十个公理，见 4.1 节的第一个定义. 


vector subtraction [向置减法]计算“ + 且将其写成 “- v . 


W 


weighted least squares [带权的最小二乘]带有权值内积所对应的最小二乘问题，例如 
<x,y>=wlx^ +.“ + w„ 2 jc„;y„ 
weights [权值]一个线性组合中所用的数. 

Z 

zero subspace [零空间]仅包含一个零向量的空间 { 0 }. 

zero vector [零向置]惟一的向量，记为 0 ,使得《 + 0 = “对所有《成立，在 R " 中，0是一个所有元素 
为零的向量. 
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第1章 


1. 解是 U.；C 2 ) = (-8,3) ，或简单写成 (-8,3). 

3. ( 4/7,9/7 ) 

5. 替换第2行为第2行加3乘以第3行，然后替 
换第1行为第1行加 -5 乘以第3行. 

7. 解集为空集. 

9. ( 4,8,5,2 ) 11. 不相容 

13. ( 5,3-1 ) 15.相容 

17. 这三个平面有一个交点. 

19. h 本1 21. 所有 h 

23. 标记一个命题为真当且仅当这个命题总是真 
的.只给出答案会达不到判断题的意义，即帮 
助你学会仔细阅读教材是重要的.“学习指导” 
告诉你在哪里可以找到答案，但你不应该在没 
有尝试自己寻找答案之前就去查看“学习指导”. 
25. k + 2g + h = 0 

27. 行化简 R 3 /] 为 p 3 ， ] 后显 

[_c d g」 [_0 d-3c g-c /」 

示必定不为零，因为/和 S 是任意值. 
否则，对/和 S 的某种取值，第2行对应于 
形式为 0 = fc 的方程，其中不为零.因此 
d ^3 c . 

29. 交换第1行和第2 行； 交换第1行和第2行. 
31. 用第3行加 -4 乘第1行替换第3 行； 用第3 
行加4乘第1行替换第3行. 

33. 47,- T 2 - r 4 =30 

-7；+47 2 - T , =60 
-T 2 +4T 3 - T a =70 
-T { - 7 3 + 47 4 =40 


1. 简化阶 梯形： a,b; 阶 梯形： d; 非阶 梯形： c. 
"1 0 -1 -2 

3. 0 1 2 3 ，主元列是第1，2 列： 

0 0 0 0 


"12 3 4 
4 5 6 7 
6 7 8 9 


U =-5-3x 2 U=4 + 5x, 

7. 是自由变量 9. =5 + 6x, 

U=3 b 是 S 由变量 


11. 


A 是自由变量 
U 是自由变量 


13. 


jci = 5 + 3x 5 
jc 2 =1 + 4x 5 
a 是自由变量 
x t =4-9x ; 

A 是自由变量 


15. a. 相容，有惟一解 b. 不相容 


17. h = H2 

19. a. 当 Zi = 2,/t#8 时不相容 

b. 当时有惟一解 

c. 当/« = 2,<: = 8时有多解 

21. 仔细阅读课本，查阅“学习指导”之前写出你 
的答案，记住，一个论断是正确的，当且仅当 
所有情形论断都正确. 

23. 是的.方程组相容是因为它有三个主元，在系 
数矩阵的第三行必有一个主元.其简化阶梯形 
不会含有形式为 [0 0 0 0 0 1] 的行. 

25. 如果系数矩阵中的每一行有一个主元位置，那 



458 


奇数习題答案 


么在底行有一个主元位置，从而在增广列没 
有主元位置，所以，根据定理2,方程组是 
相容的. 

27. 如果方程组是相容的，则解是惟一的当且仅当 
系数矩阵的每一列都是主元列，否则，方程组 
有无穷多解. 

29. 一个不确定的方程组中，未知变量的个数总多 
于方程的个数.基本变童的个数不多于方程 
的个数，所以.至少有一个自由变童，这个变 
量可以被指定无穷多 个值. 如果方程组是相 
容的，自由变量的每一个不同值会产生一个不 
同解. 

31. 是的，一个线性方程组的方程个数多于未知变 
量的个数.它可以是相容的.下面的方程组有 
一个解（七=易=1): 

*1 + * 2=2 
x 2 =0 
3x \ + 2x2 — 5 

33. [M] p(/) = 7 + 6/-/ J 

he] 

3. 


6x t — 3x 2 = 1 
- x l + 4x 2 =-7 
5 為 =-5 

通常不写中间过程. 

7. a = h- 2v, b = 2u - 2v 9 c = 2u - 3.5v, d =3u-4v 


' 0 


1 


■ 5' 


0 

4 

+ X 2 

6 

+ 太 3 

-1 

= 

0 

-1 


3 


-8 


0 


ii .是，»是《,,«:， 《 ，的线性组合 
13.否， J 不是 A 的列的线性组合. 

15. 当然，非整数权值也可以接受，但一些简单选 
择是 0-V|+0-v 2 =0, 且 



■ 7 


-5 

•V| +O-V 2 = 

1 

， 0 ^!+1^ 2 = 

3 


-6 


0 


2 


12' 

V t +\V2 = 

4 

l-v,-lv 2 = 

-2 


-6 


-6 


17. * = -17 

19. Span{v l ,v 2 } 是在通过 v, 和原点的直线上的点集. 
21- 提示： 证明7 ^对所有和 ik 是相容 

的，解释这个计算能说明 Span{ B ,v} 是什么. 
23. 在你査阅“学习指导”之前，先仔细阅读整节 
内容.特别注意定义和定理的叙述，和在其前 
后的言论. 



2 5 . a. 否 • 3 b •是，无穷多 

c. Ai = l-ai+O az+0 a 3 
27. a. 5〜是5天工作1利 T 的产出. 

b. 总的产出是从, + x 2 v 2 , 所以; t, 和為应该满 
足 Jt|Vi + X2V2 = [ 15 。] • 

c. [MJ1.5 天生产1#矿和4天生产2#矿. 

29. (1.3, 0.9, 0) 



b. 在 （ 0，1 ) 点加 3.5 克，在 （ 8，1 ) 点加 0.5 
克，在（2,4)点加2克. 

33. 复习练习题1再写出解答，“学习指导”有参 
考解答. 
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1.4 

1. 乘积无定义，因为 3x2 矩阵的列数为 2, 面向 


童的元素个数是3,两者不匹配. 


3. Ac = 

■6 5- 

-A -3 

[扣. 

- 6 

-A 

-3] 

_ 5 

-3 


_7 6」 


7 

! 

6 


12 


-15 


-3' 

-8 

+ 

9 

= 

1 

14 


-18 


-A 



6 5- 


6_2+5.(-3> 


-3 

Ax = 

■11 

[-3]= 

M)-2 + (-3)(-3) 
7 2 + 6 (-3) 

= 

1 

-A 


在这里以及习题4~6展示你的工作，以后的习 
题计算过程用心算- 

5 W_[lh •[- 扣 ] 

r a e ^-i r r~\ 


4-5 1 

一 1 3 -8 

V 


' 6 

-8 

7-5 0 

-A 1 2 

x 2 


0 

-7 


■ X 3 - 



1 2 4 -2 


V 


' 0* 

11. 

0 15 2 

，jr = 


= 

-3 


r 2 ^4 -3 9 


■气 


1 


13. 是（验证你的答案）. 



•(在这里！ 


15. 当36+&非零时，方程如=办不相容.（给出 
理由 •） 所有使方程 Ac =6 相容的6组成的集 
合，是一条通过原点的直线 fc 2 =-3 ft . 

17. 只有 3 行含有 主元. 由定理 4, 方程 A*=* 不 
是对 R 4 中的每个6都有解. 

19. 习题17说明定理4命题 （ d ) 不真，因此不是 
R 4 中的所有向量都可以写成 A 的列的线性组 


合有解，即 A 的列不能生成 R 4 . 

21.矩阵 [v, v 2 v 3 ] 不是每一行都有主元，因此由 
定理 4. 矩阵的列不能生成 R 4 ,即 {v„v 2 ,v 3 }^ 
能生成 R 4 . 

23. 仔细阅读教材.在査阅“学习指导”之前先判 
断习题中每个命题的真假.习题29~30中的许 
多命题是这种形式的蕴 涵式: “如果 <命题1>, 
则<命题2>” 或等价的，“有<命题2>,如果 
题1>成立当<命题1>为真时，如果在任何 
情形下<命题2>都成立，则将这样的蕴涵式标 
记为真. 

25. a = - 3 , c 2 = - l , c 3 = 2 

V 

27. Qx = v , 其中 G = [fli 仍 qj \ x = x 2 注意， 
x , 

如果你的答案是方程 Ax = b , 你需要说明 A 和 
ft 是什么. 

29. 提示 :从有 3个主元位置的 3x3 阶梯形矩阵 
开始寻找. 

31. 査阅“学习指导”之前写出你的解答. 

33. 提示： A 有多少主元列？为什么？ 

35. 给出 AduAxph ,你需要说明方程 
= 有解，其中 h » = > i +> 2 •观察到 
•v = A *, + Ajc 2 ,利用定理5 ( a ) 将 x ,, x 2 分别 
代替 u , v , BPnf = Ac , + Ac 2 = A ( jc ,+ x 2 ) ,因此 
向董* =私+*2是 = 的解 • 

37. [M] 列不生成 

39. [M] 列生成 

41. [M] 在习题39中划掉矩阵的第4列.也可以 
不划掉矩阵的第4列，而是划掉矩阵的第3列. 

1.5 

1. 方程组有非平凡解，因为有自由变量 a . 

3. 方程组有非平凡解，因为有自由变量 jc 3 . 



V 


5 

5. x = 

x 2 

=X 3 

_2 

1 
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■ 8' 

义2 

=J ; 

+又 4 

-5 




0 

.气 

[ 0」 


1 


"3" 


'-2 

1 

+ JC 3 

0 

0 


1 


11. 提示： 由阶梯形推出的线性方程组是 
jci - 4 jc 2 + 5 jc 6 = 0 
x 3 - x 6 =0 
x 5 - 4 x 6 =0 
0 = 0 

基本变量是4，^^，其他变量是自由变量. 
“学习指导”讨论了两种这类型题目常犯的错误. 


5i r 4 

13. x = -2 + x 3 -7 =p + x 3 9 .在几何上，解集是 
0 1 


通过 -2 且平行于 -7 的直线. 
0 1 


15. jc = 

义 1 

x 2 

- 

-i 

1 

+ 文 3 

5' 

-2 

. 解集是通过 

1 


/3 


0 


1 


0 


答案. 

25. a . Aw = A(p + v h ) = Ap + Av h =b + 0 = b 
b . Av h = A(w - p ) = Aw - Ap = b-b = 0 

27. 当 4 是 3 x 3 非零矩阵， R 3 中任一 x 满足方程 
Ax = 0 , 因此解集是 R 3 中所有元素. 

29. a . 当4是 3 x 3 矩阵，有3个主元位置，方程 
Ar = 0 没有自由变量，因此没有非平凡解. 
b . 有3个主元位置时，4在每一行有一个主 
元，由 1.4 节定理4,方程九》: = «»对每个可 
能的6都有一个解.“可能”的意思是此处 
考虑的向量是 R 3 中的向量，因为4有三行. 

31. a . 当4是 3 x 2 矩阵，有2个主元位置，每一 
列是主元列，方程 Ar =0 没有自由变量， 
因此没有非平凡解. 

b . 有2个主元位置和三行时，4不可能在每一 
行有一个主元，由 1.4 节定理4,方程 
不可以对每个 R 3 中可能的6都有一个解. 



35. 你的例子中应该有每行的元素之和等于零. 
为什么？ 


直线，平行于习题5中齐次线性方程组解集的 
直线. 


17. 


-9 


4 


'-2 

1 

，v = 

0 

，P = 

0 

0 


1 


0 


,齐次线性方程组 


的解是 JC = JC 2 H + JC 3 V ，由 H 和 V 所生成的通过原 
点的平面.非齐次方程的解集是 
x = p + x 2 u + x 3 v , 此平面通过 p ,平行于齐次 
线性方程组解集的平面. 


19. x=a + tb ,其中 f 为参数. 



23. 非常重要的是仔细阅读课本，然后写出你的答 


案.完成之后，如果需要，用“学习指导”校对 


37.—个答案是 A = p 二 L “学习指导”给出如 

何分析问题以构造 4. 如果6不是 A 的第一 
列的数倍，则 Ac =6的解集为空，因此不可能 
平移 Ar = 0 的解集来得到的解.这并 
不与定理6相矛盾，因为定理6仅当方程 
有非空的解集时才成立. 

39. 如果 c 是数，则由 1.4 节定理5 ( b ) 有 
A { cu ) = cAu . 如果 II 满足 Ac = 0 ， 则 
Aw = 0 ,cAw = c 0 = 0 ,因此 A ( cw ) = 0 . 


1.6 

1. —通解是 P _=0.875 p 服务，此处 p 服务是自由变 
量，一个平衡的解是/^=1000和/^ =875. 
使用分数， 一般 解可写成0_=(7/8)尸服务，一个 
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自然的价格取值是 P 祕 =80, pm ="70. 只有价 
格的比例是重要的，经济平衡不会受一个价格 
变化的影响. 
a. 

产出分配 


c. [M] p 化丨 ==141.7 ，/?心油 = 91.7 ， p 机械 =100 ■ 精确 
到两位有效数字， 尸化， =140，〜, 油 =92, 

p nw = 100. 

5. B 2 S 3 +6H 2 0 ^ 2H 3 B0 3 +3H 2 S 
7. 3NaHC0 3 + H 3 C 6 H 5 0 7 Na 3 C 6 H 5 0 7 + 3H 2 0 

+3C0 2 

9. [M] 15PbN 6 +44CrMn 2 0 8 — 5Pb 3 0 4 + 22Cr 2 0 3 
+88MnO 2 +90NO 


jc 3 的最大值为 20. 


Jt, = 20 —jc 3 
jc 2 = 60 + :c 3 
x 3 是自由变量 1 

X 4—60 

jc, = jc 3 -40 
jc 2 = x 3 + 10 
x 3 是自由变量 
jc 4 = x 6 + 50 
jc 5 = jc 6 + 60 
和是自由变量 


对习题 1~22 验证你的答案. 

1. 线性无关 3. 线性相关 


x =50 

^3=40 

jc 4 =50 

jc 5 =60 


5 . 线性无关 
9. a. 没有 h 
11. h = 6 
15. 线性相关 
19. 线性无关 


7. 线性相关 
b. 所有 h 
13. 所有 h 
17. 线性相关 



化工 

石油 

机械 


21. 

产出 

i 

丄 


1 

投人购买部门 




0.2 

0.8 

0.4 

— 化工 




0.3 

0.1 

0.4 

石油 

23. 



0.5 

0.1 

0.2 

^ 机械 



0.8 

-0.8 

-0.4 

0* 



27. 

b. 

-0.3 

0.9 

-0.4 

0 





-0.5 

-0.1 

0.8 

0 





失去做这类题目的意义. 


0 ■ 

0 0 


「0 ■. 
0 0 
0 0 
0 0 


程 = » 有自由变量，此时， A 的列线性相关. 
29. 4: 任何有两个非零列的 3x2 矩阵，但两列不 
是相互有倍数关系，此时，这两列线性无关， 
因此方程 Ar = 0 只有平凡解. 

S: 任何有一列是另外一列倍数的 3x2 矩阵. 


31. 


33. 由定理 7 可知，真.（“学习指导”补充了另 
外的验证 .） 

35 .错，向量 v, 可能是零向量. 

37. 正确，*>,，*> 2 ,*> 3 之间的线性相关，通过选取¥ 4 的 
权值为零可以扩展为》^ 2 ，*> 3 ，》> 4 之间的线性 
相关. 

39. 你有能力在没有帮助的条件下做这个重要的 
题目.在查阅“学习指导”之前写出你的解答. 
8-3 2] 


41.[M] B = 


其他可能性如 


_ 8 

0 

2 

_ 8 

-7 2 

-9 

5 

一 7 

-9 

11 -7 

6 

2 

4 

6 

-4 4 

5 

7 

10 

5 

0 10 


43. [M] 4 中不属于 B 的每一个列，属于 B 的列所 



462 


生成的集合. 

1.8 



LcJ 

11.是，因为 U ft] 所表示的方程组是相容的. 
13. 


通过原点的对称 
15. 


到 x 2 轴上的投影 

I ? •[測 I 樣 T :] 

21. 仔细阅读课本，在査阅“学习指导”之前写出 
你的答案，注意练习 21(e) 是下列形式的句子， 
"〈命 题丨〉当且仅当 〈命题 2广 


_ 奇数习題答案 

标出这样的句子是真的，如果 〈命题 1 >真时， 
在任何情况下〈命題2〉是真的，并且如果 〈命题 
2> 真时，在任何情况下 〈命题 是 真的. 

23. 



25. 提示：利用直线的参数方程表示直线的像（即 
直线上的点的像组成的集合）. 

27.«_通过夕和《的直线平行向董《-/».(见 1.5 
节图 1-27.) 由于通过/»点的直线的参数方 
程是 Jr = p+f(«-p). 进而 x=/»-}»+*7 ,得到 
x = (\-t)p + tq. 

b . 对考虑 x = (l-f)/»+ 坷，通过 r 的线 
性，对 (KK1 有 

nx) = T(f\-t)p-Hq) = {l-t)T(p)+tT(q) ( * ) 
如果 r(p) 和 r ⑷不同，则方程 （*) 构成 n P ) 
和 r(«) 之间的一个线段，如 （a) 所示.否则， 
像集只是一个点 r(/0, 因为 
a- t)T(p) + tT(q) = (1 - t)T(p) + tT(p) = n P ). 

29. a. ^b = 0,f(x) = mx , 对任何 R 中的和任 
何数 d 

f(cx+dy) = m(cx+dy) = mcx+mdy 

=c(»«) + d{my) = c- f(x)+d /(>) 
这说明/是线性的. 

b. 当 /(jt) = mx+fc 时，其中 fc 非零， 
/(0) = «(0)+<>=*^0. 

c. 在微积分中./称为线性函数，因为/的 
图像是一直线. 

31. 提示： 由于 {v„v 2 ,v 3 } 线性相关，你能写出一些 
方程且解出它. 

33. 一种可能性是验证 r 不将零向董映射为零向 




奇數习題答案 


463 


量： r ( o , o ) = (0,4,0)，但是，每个线性变换必 
须将零向量映射为零向量. 

35.取 R 3 中的《和 v , c ， d 为数，则 


cu + dv = ( cui + dvuCU 2 + dv 2 yCU 3 + dv 3 ) ,线性变 

换 r 是线性的，因为 

T(cu + dv) = (cui + dvi , CU2 + dv 2 , -( cm 3 +dv 3 )) 

= (cui + dv u cu 2 + dv 2t ~cu 3 - dv 3 ) 


(cuucu 2 ,-cu3) + (dvudv 2 y-dv 3 ) 


= C(m i ,M 2 ,-M3) + ^(Vi,V 2 ,-V 3 ) 

= cT ( u ) + dT ( v ) 

37. [ M ] 所有 （7,9,0,2) 的倍数. 

39. [ M ] 是，对 o : 的一个选择是 （4,7，1，0) 


1.9 

「3-51 



Ll 0 j 

[-1/V2 1/V2] [ 0 -ll 

.I.1/V2 1/V2J ' L-i 2J 

11. 所描述的变换^'将々映射为，将映射为 
旋转 n 弧度也可以将映射为4,,将 
映射为因为一个线性变换完全由它 
对单位矩阵的列的映射而确定,这样的旋转变 
换对 R 2 中的每个向量的作用跟 r 是一样的. 
13. 


15. 


19. 




23. 査阅“学习指导”之前先回答问题. 
对习题25~28验证你的答案. 


25. 不是一对一的和不是将 R 4 映上到 R 4 的映射. 
27. 不是一对一的，但是将 R 3 映上到 R 2 的映射 


1_0 0 0」 

31. n . (解释为什么，然后査阅“学习指导” .） 
33. 提示： 如果~是单位矩阵的第 ; ’列，那么％ 
是 S 的第 y 列. 

35. 提示： m > n 可能吗？对 m < n 怎么样？ 

37. [ M ] 否 （ 解释为什么）. 

39. [ M ] 否 （ 解释为什么）. 

1.10 


110 


.130 


'295' 

4 

+ x 2 

3 


9 

20 

18 


48 

2 


5 


8 


，此处々是 Cheerios 


份数，是100%天然麦片的份数. 


b . 


•110 

130' 


'295' 

4 

3 

M- 

9 

20 

18 

UJ " 

48 

2 

5」 


8 


• 混合 1.5 份的 Cheerios 


和1份100%的天然麦片. 


•36 

51 

13 

80 ■ 

V 


' 33 ' 

52 

34 

74 

0 

X2 


45 

0 

7 

1.1 

3.4 

X3 


3 

1.26 

0.19 

0.8 

0.18 

X 4 


0.8 


此处 


々，…分别表示将用于混合物所需的脱脂 
牛奶，大豆粉，乳淸和大豆蛋白的单位 （ 100 


克）数量. 

b . [ M ] “解”是 4 = 0.64, x 2 = 0.54, x 3 = -0.09, 
^4 =-0.21. 解不是可行的，由于负数量的乳 
淸和大豆蛋白是不可能的. 


" 5 

-2 

0 

O ' 



' 40' 

-2 

11 

-3 

0 

h 


-30 

0 

-3 

17 

-4 

h 


20 

0 

0 

-4 

25 

l K 


-10 
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■ 7.56' 

/ 2 


-1.10 



0.93 



-0.25 


■12-7 0 - 4 ' 

h 


~ 40 

-7 15 -6 0 

h 


30 

0 -6 14 -5 

h 

一- 

20 

_-4 0 -5 13 

./ 4 . 


-10 




"11.43' 



10.55 



8.04 

U 」 


5.84 


9. 太*+1 = 灸= 0，1，2，- • •，此处 

「0.95 0.04] . ("6000001 

_|_0.05 0.96 J ^" L ^ OOoJ 

2002年的数量（当 * = 2 ) 是 jc 2 = f 57326 °l 
[426 740 J 

,, w 「0.982 85 0.002 581 

11. a. A/ = 

L 0.01715 0.997 42 J 
L rwi [ 30 223 0001 
MMJ ^=[218487 000]' 达到最接近 4 位. 

13. [M] a. 城市的人口减少 ， 7 年后，人口会相等， 
但城市人口数量继续减少 .20 年后，城市人 
口仅有 417 000 人 .（ 注意： 417 456 在千位 
上四舍五人 .） 但每年的人口变化数量会越 
来越小. 

b . 城市人口缓慢增长，郊区人口减少 . 20 年 
后，城市人口将从 350 000 增长到 370 000 
(注 意： 370283 在千位上四舍五人）. 

第1章补充习题 

1- a. F b . F c. T d. F e. T 

f-T g.F h.F i.T j.F 

k. T 1. F m. T n. T o. T 

P - T q. F r . T s. F t . T 

u. F v. F w. F x. F y. T z. F 

3. a . 任一具有 3 个方程的相容的方程组，其阶梯 


形为 


" B * * 


'■ * 氺 


'o ■ * *' 

0 ■ * *| 

或 

0 0 ■ * 

或 

0 0 _ * 

0 0 0 0」 

1 

.0 0 0 0」 

1 

0 0 0 0 


b . 任一具有3个方程的相容的方程组，其阶梯 
形为 /;. 


c . 任一具有3个变量和3个方程的不相容的方 
程组. 

5. a . 解集： （ i ) 如果/^12且 h 2, 是空集， （ ii ) 
如果 A * 12 ,包含一个惟一解， ( iii ) 如果 h = ll 
且灸= 2,则包含无穷多解. 
b . 解集为空，如果 A + 3 A = 0, 否则解集包含一 
个惟一解. 


7. a . 令 V ,= 

" 2" 

一 5 I 

，H 

'- 4 ' 

， v 3 = 


和 A = | 

V 

h 

1 


i 

_-5 」 


'-3j 

1 

A. 


‘判断 v ,， v 2 , v 3 是否可以生成 R 3 ”，答案：否. 


' 2 - 4-2 

b . 令4= - 5 1 1 ， “判断4的列是否可以 

7 -5 -3 
生成 R 3 .” 

c _ 定义7^)=射，“判断 r 是否将 R 3 映上到 

9 [3谱綱3=&口. 

10. 提示： 在平而画出由 fl | 和 fl 2 确定的格线. 

11. 当方程组有一个自由变量时，解集是一条直线. 
如果系数矩阵是 2 x 3, 则三列中有两列是主元 

列.例如，取系数矩阵 G g g ， 在第3列随 

便放值，所得矩阵是阶梯形.对第2行做一次 
行变换以产生不是阶梯形的矩阵，例如 

12. 提 tk : 方程 Ar = 0 中有多少个自由变量？ 

'1 0 -31 

13 . 0 1 2 

0 0 0 
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15. a . 如果三个向量线性无关，则 a , C ,/ 必定全不 

为零. 

b . 数 a , …,/可取任意值. 

16. 提不：从右向左将列写为 v 丨, '“， v 4 _ 

17. 提示： 使用定理 7. 

19 .设 Af 为通过原点的直线且平行于 v, ， v 2 ， v 3 三点 
所连成的直线，则都在 Af 上， 
因此两个向量成倍数关系，比如 
V 2 -V,=it(V3-V,). 这个方程给出了线性相关关 
系： （ Z:-1)V| + v 2 -fcv 3 =0 . 第二种解法：直线的 
参数方程是； C=v,+f(v 2 - V,), 由于 v 3 在直线上， 
存在一心使得 v 3 =v,+ ； o(v 2 - V,) = (1 - 〜 )V, + f 0 V 2 . 
因此 v 3 是 v ,* v 2 的线性组合，并且 { v ,, v 2 ，M 
线性相关. 

"1 0 0 " 

21. 0 -10 23. a = 4/5 ，办=-3/5 

0 0 1 

25. a . 当建造 4 层的4设计时，向量列出有3, 2 
和1个卧室的公寓数目. 



c . [ M ] 利用 A 设计的2层和 B 设计的15层， 
或 A 设计的6层、 B 设计的2层和 C 设计 
的8层.这些是仅有的可行解.也存在其他 
数值解，但它们需要一个或两个设计的负数 



'-i 


_ 4. 


-7 4' 

5. a . Abi = 

7 

, Ab 2 = 

-6 

， AB = 

7-6 


12 


-1 


12-7 


"-1 

3+ 2(-2) 

-1 

〔-2) + 2. 

*1 h 7 


b. AB = 


5.3 + 4(-2) 5(-2) + 41 

2. 3 -3(-2) 2(-2)-3.1 


7. 3 x 7 9. k -5 


11. AD = 

■2 3 5' 

2 6 15 

,DA = 

—2 2 2 

3 6 9 


2 12 25 


5 20 25 


被 D 右乘 （ 即在右边乘）是用 D 相应的对角元 
素乘以4的每一列.被 D 左乘是用 D 相应的 
对角元素乘以4的每一行.“学习指导”告诉 
你如何使 AB = BA ,但你应该在査阅之前先自 


己试一试. 


13. 提示： 两个矩阵中的一个是 2. 

15. 在査阅“学习指导”之前回答这个问题. 

17. 私0= 口] 

19. 的第3列是前两列之和，以下是原因. 
记 fl = [ A , b 2 &]， 根据定义，的第3列 
是你，如果 A 3 = A ,+ A 2 , 那么由矩阵向量乘 
法的性质可知 Afi 的第三列是 


Ab z = A(b, +b 2 ) = Ab, + Ab 2 . 

21. 4 的列是线性相关的，为什么？ 

23. 提示： 假若 jc 满足 Ac = 0, 且证明 jc 必须是 0. 
25. 提示： 使用习题23和24的结果，并对乘积 
C 4 D 使用乘法结合律. 


的楼层，这没有实际意义. 

第2章 


27. 


u T v = v T u = - 2 a + 3 b - 4 c 
l ~ 2 a - 2 b - 2 c ~\ 


3 a 3 b 3 c 
- 4 a - 4 b - 4 c 


- 2 a 3 a - 4 a 
- 2 b 3 b - 4 b 
- 2 c 3 c - 4 c 


2.1 

没有定义，口 匕: 


29 . 提示： 对定理 2( b )， 证明 4 (fl + C ) 中 （ U ) 元 
素和 AB + 4 C 中的(^)元素相等. 

31. 提示： 利用乘积/<^的定义和对 R " 中的 jc 有 
/„jc = jc 的事实. 

33. 提 示：首 先写出 （ Afi) T 的（!_，）)元素，它是仙的 
(),0 元素，然后利用矿中第 i 行的元素是 
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核 歹超 答案 


H ， 它们来自的第! 列， 并且，■中 
第 J 列的元素是…它们来自4的第 J 
行，由行一列法则， S T /T 中元素 （《_,)) 是 
buOji + ■•• + b ri a ln . 

35. [M] 这里的答案依赖于你选取的矩阵程序，对 
MATLAB ,利用帮助命令査阅 zeros, ones, eye 
和 diag. 对 TI-86 计算器，学习 dim，fill 和 iden 
指令.在 TI-86 中没有一个 “diagonal” 指令. 

37. [M] 报告你的结果. 

39. [M] 矩阵 S 移动向量 ( a ,W， e ) 中的元素得到 
(b,c,d,e,0). 夕是 5x5 的零矩阵.夕也是如 
此. 


2.2 



5. x, = l,x 2 =-9 


对 fl 和^ JC 的解： 




9. 在査阅“学习指导”之前写出你的答案. 
11. 证明可以类似定理5的证明那样完成. 


式中的4和互换位置，然后用单位矩阵代替 


rowi(A) 

B. 对 （b) 和 （c), 先将 A 写为4= row 2 (A) 



33.A-'=fi= 0—11 . 提 示：对 

0 0 _ . ■ — 1 1 


X…， n ， 设^，匕， t 分别表示次氏/的第^/ 
列，利用对 j = l， …， n-l ， 有 <1广<| ;+1 =心和 
bj ~ej-e jH ,并且 a =e n . 

' 3' 

35. -6 ， 通过行化简 U u 3 ] 求得. 

4 

37. C = f 1 1 ''I 

L-i i oj 

39. 分别是 0.27, 0.30 和 0.23 英寸. 

41. [M] 分别为 12 ， 1.5, 21.5 和 12 牛顿的力. 


2.3 


13. AB = AC=> A 'AB = A'AC => IB = IC=>B = C 
否.一般地，如果 4 不可逆，则 B 和 C 可能不 
同•见 2.1 节习题 10. 

15. D = C-'B 'A \ 验证 Z) 满足要求. 

17. 4 =执:化 1 (一般地， BCB '^C ). 

19. 当找到 X=CB-4 后，验证X是一个解. 

21. 提示： 考虑方程 Ar=0. 

23. 提示： 如果 Ac=0 仅有平凡解，那么方程 
Ar=0 没有自由变量，且4的每个列是一主 
元列. 


25. 提示： 考虑当 
_-b 


'-b 

a 


厶= 0的情形，然后考虑向量 
且利用事实 ad - be = 0. 


27 -提示：对 （a), 将 2 .1 节中例6后的方框中公 


为节约答案的篇幅，我们用 IMT 表示可逆矩 
阵定理（定理 8). 

1_可逆，由 IMT， 列线性无关，因为矩阵的任一 
列不是其他列的倍数，并且，由 2.2 节定理4, 
行列式不等于零，因此矩阵是可逆的. 

"5 0 0' 

3. 可逆，由 IMT， 矩阵行变换后变为0 _ 7 0 

0 0-1 

且右3个主元位置. 

「10 2 ' 

5. 不可逆，由 IMT, 矩阵行变换后变为0 3 _ 5 
0 0 0 

且不是行等价于/ 3 . 

7.可逆，由 IMT ，矩阵是行变换后变为 
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-\ -3 0 r 

0 —4 8 0 口亡，人 + — /a •堪 

0 0 3 0且有 4 个主兀位置' 

0 0 0 1 

9. [ M ] 4 x 4 矩阵有4个主元位置，由 IMT , 矩阵 
可逆. 

11. “学习指导”会帮助你，但首先要建立在仔细 
阅读课本的基础上，尝试回答问题. 

注意，一个蕴涵论断是错的仅当存在一个实例 
使得，〈论断2〉是错的，但〈论断1〉是正确的. 

13. -个上角形方阵是可逆的充分必要条件是 
所有在对角线上的元素非零，同样结论对一个 
下三角形方阵也成立.为什么？ 

注意： 习题 15-29 的答案与 IMT 有关.在许 

多时候，部分或全部的答案可以是基于用来建立 

IMT 的结论. 

15. 如果4有两个相同的列，则它的列是线性相关 
的 . IMT 的 （ e ) 命题说明4不可能是可逆的. 

17. 如果4可逆，由 2.2 节定理6, / T 1 也可逆，对 
妒应用 IMT 的命题 （ e ), 得到 / T 1 的列是线 
性无关的. 

19. 根据 IMT 中的命题 （ e ), Z ) 是可逆的.于是由 
IMT 中的命题 （ g ), 方程对所有属于 R 7 
的 A 有一个解，你有更多结论吗？ 

21. 由 2.2 节定理5或 IMT 下面的段落，矩阵 G 不 
可能是可逆的.因此 IMT 中的命题 （ g) 是假 
的，同样 （ h )也是假的，即 G 的列不能生成 R". 

23. 对《， IMT 的命题 （ b ) 是假的，因此命题 （ e ) 
和 （ h ) 也是假的，即的列线性无关，且其 
列不能生成 R ". 

25. 提示： 首先利用 IMT . 

27. 由于是可逆的，存在一个矩阵 W 使得 
= / 且有 = / ，但是，由这个计算 
本身不能证明 A 是可逆，为什么不能？在査阅 
“学习指导”之前完成证明. 

29. 因为变换； At 不是一对一的， IMT 的命题 
( f ) 是假的，因此命题 （ i ) 也是假的，变换 


jc H Ar 不能将 R " 映上到 1 T ，并且4是不可 
逆的，由此根据定理9推出变换 Ac 是不 
可逆的. 

31. 提示： 如果对任一方程有一个解， 
那么 A 的每一行有一个主元 （ 根据 1.4 节定理 
4). 方程 Ac =6是否有自由变量？ 

33. 提示： 首先证明 r 的标准矩阵是可逆的，然后 


使用定理证明广00 = &，其中 = 



35. 提示： 为了证明 r 是一对一的，假设对 R ” 中 
的向量《和 V ，有 r ( K )= r ( v ), 证明 n = v . 为 


了证明 r 是映上的，假设 _ y 表示 it 中的任一 
向量，利用 s 的逆来产生一个向量:使得 
T(x) = y. 第二种证明可以使用定理9及 1.9 
节中的一个定理. 

37. 提示： 考虑 r 和 {/ 的标准矩阵. 

39. 因为 r 是满射，给定 R " 中的任一 V ， 存在某 
向量 I ,有 v = r ( jc ). 则 s 和 f ； 的性质说明 
只 v) = 5(T(JC)) = JC 和 U(v) = U(T(x)) = JC ，因此 
只 v ) 和 f /( v ) 对每个 v 都相同，亦即 S 和 {/是 
从 R " 映射到 R " 的同一个函数. 

41. [M] a. (3) 的精确解是々 =3.94 和 4 =0.49. 
(4) 的精确解是文,= 2.90 和文 2 = 2.00. 

b . 当用 （4) 的解作为 （3) 的一个近似解， 
近似解 •》：, 取 2.90 时误差为26%,近似解^ 
取 2.0 时误差为308%. 

c . 系数矩阵的条件是 3363, 从 （3) 和 （4) 
的解改变的百分比大约是 7700 倍方程右端 
改变的百分比.这与条件数是同样阶的大小. 
条件数大约给出方程 Ac =6的解随6改变的 
敏感性的粗略度量.更进一步关于条件数 
的信息在第 6 章的最后和第 7 章中给出. 

43. [ M ] cond ( A ) = 69000, 位于 10 4 和 10 5 之间，所 
以大约4或5位数字的精度可能丢失，一些用 
MATLAB 的实验可以验证，1和*,有大约11 
或12位数字相一致. 


45. [ M ] 当要求对一个阶数为12或更大的使用浮点 
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奇数习题答案 


数的希尔伯特矩阵求逆时， MATLAB 给出一个 
聱告，乘积 AT 1 的非对角元素会有非零值.如 
果没有出现这种情况，尝试-个更大的矩阵. 


2.4 

丨 . [m + C £fl + Z )」 [W X 一 

5. K = 1 (解释为什么）， X =- B ' A,Z = C 

7. 为什么？）， K = -A4-'ZsfM 为什么？ ) 

9. X — — A 2 \ Au y Y = —A 3 |A}/, B 22 — A 2 2 — 

11 . 你可査阅“学习指导”中的参考. 

13. 提示：若 A 是可逆的，且取 A - =，证 

明肋=/和 CG = /，这说明 B 和（:可逆.（解 
释为什么！ ） 相反，若 B 和 C 可逆，为证明4是 
可逆，猜测/I 1 是什么并检查. 

15 卜叫 = [/ Ol U, 01 p A,r'A l2 l 
' L ^. a 22 」 _ [> WL 0 d [o / J ' 

此处 S = A 12 - A 21 A u ' A 12 . 

17. G itl =[A- ( 〜 ][:/"| = H T +uL 


只有外积矩阵需要计算（然后加到 G t 
上）. 

19. W ( s )^ I m - C ( A - sI„)'B . 这是系统矩阵 
A - sI „ 的舒尔补. 

""1 + 0 0 + 0 

0 + (- 1) 2 


21 - 

=口 

口口 


" I "/ 0' 
2 - 1_0 /_ 


_ Ta 2 +o 0 + 0 

~[ a-A Q + (~ A )\ 

23. 如果 A 和取是（灸 + 1)x( 灸 + 1) 且为下三角形，那 
么我们可以写出 0 :]和战=[":]， 
此处 A 和 B 是 Axyt 且为下三角形， v 和》>属 


于,且^和6是适合的数，假若任意 Axfc 下 
三角形矩阵的乘积是下三角形矩阵，然后计算 
乘积4找，你能得出什么结论？ 

25.利用习题13求形如 fl = [ 的矩阵 

的逆，其中队是 pxp，fi 22 是忍可逆. 
将矩阵4分块，用两遍你的结果求得 



0 0 0 ' 

0 0 0 

1/2 0 0 

0 3 -4 

0 —512 7/2 


27. [M]a, b 习题中要使用的命令依赖于所使用的 
矩阵程序. 

c 从分块矩阵方程 t Z ] [: B :]， 其 
中; C ,， 私属于 R 2 °， x 2 ， A 2 属于 R 3 °， 可以得到 
4. X , ,从而可以求出； c , ，从方程 

^21-^1 + 422文2 =办2得到 ^22^2 =办2 — 421文1 ,再 
通过行简化矩阵 [4 c ] 求出； c 2 , 其中 
c = b 2 - A 2 x x x . 


2.5 



* 3" 

Ux ~ y => x = 4 

-6 
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I 0 0 0" 

-1 10 0 

4 5 10 

- 2-10 1 
1 0 01 

3 1 

- 1 / 2-2 
"1/4 


1 3-5-3] 

0—231 
0 0 0 0 

0 0 0 0 

"2^4 -2] 
0 3-5 

0 0 0 
3/8 1/4] 


17. u ~' = 

0 - 1/2 1/2 , 


0 0 

1/2」 


'10 0' 


L l = 

1 1 0 



-2 0 1 



1/8 3/8 1/4 

A ~ l ^= 

-3/2 -1/2 1/2 


-1 ( 

)1/2 


19. 提示： 考虑行简化 [A /]. 

21. 提示: 将行变换表示为一系列初等矩阵的乘积. 
23. a . 将 D 的行表示为列向量的转置.那么从分 
块矩阵的乘法 得到： 


A = CD = [ci ■•- c 4 ] 


=C|Vi t +---+c 4 vJ 


b . A 有 40000 个元素.由于 C 有1600个元素 
且 Z ) 有400个元素，两者合在一起只占存 
储 A 所需的5%. 

25. 解释为什么 t /, D 和 V T 是可逆的，那么对可逆 
矩阵的乘积的逆运用一个定理. 

27. a . 


t ji 

i - 

(2 • r h 


Vl 

1/2 ft 

V2 

十 /2n 

g V 3 


j 

i 

I • 









! .*3 f 

Vl I 

i 6n 

V2 

3/4 n 


g 




參 


l + R 2 / R t 


-/? 2 


29 3 - 


,{ 中间需 求}= 


__==__綱 

= = = =-£/-' 
_i===»A-' 

: iill=r 

_Eirs 

Eri-;? 

^ - ^可计 


1020- . — _ 
-1 1..6.2 
=1121 
r .11. 


010 


0.100.30f 


. 6.2 
■11. 


0 3 
131.110. 
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11. 提示： 利用转置的性质得到 〆 =/> T C + 〆 ， 使 
得 p'x = (/ > T C + v T )x = p T Cx + v T x 现在用乘积 
方程计算 p T x . 

13. [ M ] x = (99 576,97 703,51 231,131570,49 488, 
329554, 13835). 答案 x 中的元素比在 d 中 
只精确到接近千位的元素更准确，所以，更实 
际的 x 的答案是 x =1000 x (100, 98, 51，132, 
49, 330, 14). 

15. fM ] x ( l 2) 是第一个向量，其元素精确到接近千 
位. x ll 2) 的计算需要1260次浮算，而 
[(/- C ) rf ] 的行变换仅花费550次浮算.如果 
(:是大于20 x 20,那么用迭代计算 x (l2) 比用行 
变换计算平衡向量 x 需要更少的浮算.随着 
(:的阶数增加，迭代方法的优势会更加明显. 
而且，在经济学的较大模型中的(：变得更稀 
疏，较少的迭代就能得到所需要的精度. 


2.7 


"1 0.25 0" 


'4212 

-4212 


0 1 0 

3. 

4212 

■Jin 

2V2 

0 0 1 


0 

0 

1 


S /2 1/2 0 


5. 1/2 -V3/2 0 

0 0 1 

1/2 S/2 3 + 4S 

I. S/2 1/2 4-3^3 

0 0 1 

见练习题. 

9. 4(50) 需要 1600 次乘法，需要 808 次乘 
法，第一种方法乘法次数大约是第二种方法的 
两倍.如果 D 有20 000列，两种计算次数分别 
为 160 000 和 80 008 次. 

II. 利用以下 事实： 

„ 1 sin 2 ® 

seccp - tan (j? sin (j? = -— = cos<p 

cos<p cos<p 


i3 . [:时服：]，首細加线性变 


换然后对之平移 /». 


15. ( 12-6,3 ) 


"1 0 
0 1/2 
0 V3/2 
0 0 


0 0 ' 
Sn o 
1/2 o 
0 1 


19. 三角形顶点在 (7,2,0), ( 7.5,5,0), ( 5,5,0 ). 



" 2.258 6 

-1.0395 

-0.347 3" 

X 


R 

21. [ M ] 

-1.349 5 

2.3441 

0.069 6 

Y 

= 

G 


0.0910 

-0.3046 

1.277 7 

Z 


B 


2.8 


I. 集合对加法封闭，但对一个负数，标量乘法不 
封闭.（给出一个简单例子 .） 

3. 集合在加法或标量乘法下不封闭.包含在直线 
上的点的子集是一个子空间，因此任何反例必 
须使用至少一个不在这条直线上的点. 

5.否.对应于 [», » 2 «>] 的方程组不相容. 

7. a . 3个向量 VhV 2 ， v 3 . 

b . 无穷多向量. 

c . 是，/>属于4的列空间，因为方程处=/>有 
一个解. 

9.否，因为 Ap ^ d . 

II. p = 4,《 = 3， NuL 4 是 K 4 的一个子空间，因为 
处= 0的解必然有四个元素，以便与的列相匹 
配. CoL 4 是 K 3 的一个子空间，因为每个列向 
量有三个元素. 

13.对 NuL 4 作为例子选 （ 1，-2，1，0 ) 或 （ -1,4,0，1 )， 
对 CoL 4, 选4的任意一列. 

15.是，设4是用所给向量做为列的矩阵，因为行 
列式不等于零，因此4是可逆的，根据 IMT 
( 或例5 ), 其列构成 K 2 的一组基 .（ 也可给出 
4可逆的其他理由 .） 

17.是，设4是列为给定向量的矩阵，4的行变换 
表明有3个主元.所以4是可逆的，根据 IMT ， 
4的列构成 K 3 的一个基. 
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19.否，设 A 是 3 x 2 矩阵，它的列是给定的向量， 
A 的列不能张成 R 1 , 因为 A 中不是每一行有 
一个主元，所以列不能构成® 1 的一个基■(它 
们是 R 1 中的平面的一个基 •） 


21. 仔细阅读这一节，然后查阅•‘学习指导”之前 
写出你的答案.这一节内容和关键概念你必须 
现在学习，然后才能继续学习下面的内容- 



27. 构造-个非零的 3 x 3 矩阵 A ，用 A 的列的任 
意方便的线性组合作为 

29. 提示： 你*要一个非零的矩阵.其列是线性相 
关的. 

31. 如果 ColF * R 5 , 则 f 的列不能生成 K 5 . 由于 
F 是方阵， IMT 说明 F 是不可逆的，方程 
Fx = 0 有非平凡解，即 Nulf •包含非零向量. 
另外的描述方式是 Nulf ^ fO }. 

33. 如果 Co 1 G = 1 R 4 . 则 G 的列生成 K 4 . 由于 G 是 
方阵， IMT 说明 G 是可逆的，方程以=»对 K 4 
中的每个 6 都有一个解，而且由 2.2 节定理 5, 
每个解是惟一的. 

35. 如果 B 的列线性无关，则方程 Bx = 0 只有平凡 
(零）解.即 NulB = {0}. 

37. [ M ] 写出 A 的简化阶梯形，将 A 的主元列选为 
CoL 4 的一个基.对于 NuL 4, 写出 Ar = 0 的解 
的参数向量形式. 



2.9 


. 側 
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NuL 4 的基： 


-2 

1 

0 

0 


"- 5 ' 


0 

—2 


;dimNuM = 2 


b . 提示： C 的维数是多少？ 

c . 提示： fi 和(:与 4 关系如何？ 

29. [ M ] 你的计算应该说明 [ v , v 2 x ] 对应于一个 
相容的方程组， x 的谷 - 坐标向量是 （-5/3, 8/3 ). 


13. 原矩阵的第1, 3和4列构成//的一组基，因 
此 dim //=3. 

15. Col /I = R 3 ，因为的每.行有一个主元，^4的 
列生成 R 3 . NulZ 不等于 R 2 , 因为 NulZ 是 
R 5 的子空间.但 NuM 是二维的， 理由： 方程 
Ar =0 有两个自由变量，因为4有5列，当中 
只有3列是主元列. 

17. 在给出你的理由后再查看“学习指导”. 

19. Ar =0 的解空间有一组三个向量组成的基，意 
l^#dim NuM = 3. 因为5 x 7矩阵4有7列， 
秩定理说明 rank 4 = 7 -dimNuM = 4. Jil ‘‘# 
习指导”中不用秩定理来论证. 

21. -个 7 x 6 矩阵有6列，根据秩定理， 
dim NuM = 6- rank 因为其秩是4’ 故 

dim NuM = 2 ,即 Ar = 0 的解空间的维数是 2. 
23. - •个 3 x 4 矩阵4 ’ 有2维的列空间’则4有 
2个主元列.剩下的两列对应于方程中的自由 
变量.因此，直接构造这样的矩阵是可能的. 
主元列有6种可能的位置，其中之一是 
~ m * * *' 

0 - * * • 一种简单的构造方法是在 R 3 

0 0 0 0 

中取两个明显线性无关的向量，将它们按任意 
顺序放在矩阵中.所得矩阵将显然具有2维的 
列空间.无需担心 Nul A 是否有正确的维数， 
因为秩定理保证了有 dimNulyl = 4- rankyl . 

25.由定义4的 p 列生成 ColZ . 如果 
dimCoM = p ,则根据基定理， p 列的生成集 
自然成为 CoM 的一组基，特别地，这些列是 
线性无关的. 

27 . a. 提示： 的列生成州，每个向量 a ; 属于州. 
向量 c ; 属于 R p 是因为 fi 有 p 列. 


第2章补充习题 

1. a . T b . F c . T d . F 

e . F f . F g . T h . T 

i-T j.F k . T 1. F 

m . F n . T o . F p . T 

3. I 

5. A 2 =2 A-I , 乘以 得到： yl 3 = 2/ l 2 - yl . 

M A 2 =2 A-I ftA ： A 3 = 2(2 A - I)-A = 3 A -2 I . 
再乘以 A 4 = A (3 A -21) = 3 A 2 -2 A . 

再将 / = 24-/ 代人一次： 

A 4 =3(2 A - I )-2 A = 4 A -3 I . 

■7 .见 2.2 节的习题 12, [4 fi ] 的行变换得到 
10 - 1 ' 

[/ ffi ] 产生 ^5= 9 10 . 

9 - [-1 3 

11 . a . p ( x ,) = c 0 + cp , + ... + c „^ xr ' 

hi 

= row ,( V ). ; = row,(Vc ) = >>,■ 

U-J 

b . 假若々 ，…， & 是不同的，并设对某向量 c 有 
Vc =0, 那么 c 中的元素是一个在;^，…，心处 
为零的多项式的系数，但是，一个 „-1 次多 
项式不可能有 n 个零点，因此这个多项式必 
然恒等于零，也就是 C 中的元素必须都是 
零，这表明 V 中的列是线性无关的. 

c . 提示： 当々，...，；!：„是不同的，存在一个向量 c 
使得 V C = y . 为什么9 

13. a . P 2 = ( uu T )( uu T ) = u ( u T u ) u T = u ( l ) u T = P 
b . P T = ( mm t ) T = u ^ u 7 = uu T = P 
C . Q 1 ={I -2 P){I -2 P ) 因为 （ a ) 
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= 1 - 4 P + 4 P 2 = 1 

15 . 用初等矩阵左乘产生一个行初等 变换： 

B ~ E , B ~ E 2 E t B - E 3 E 2 E t B = C , 所以 fi 是行等 
价于 C , 因为行变换是可逆的， C 行等价于 S 
(换言之，利用£,的逆作行变换可证明 c 被变 
为 S .) 

17. 由于 S 是 4 x 6 ( 列数多于行数），它的6列线 
性相关，且有非零 x 使得&: = 0 ,于是 
ABx = A 0 = 0 ,由可逆矩阵定理，说明矩阵 


是不可逆的. 

19. [M] 对 4 位小数，当&增加时， 
"0.2857 0.2857 0.2857 — 
A 1 -> 0.4286 0.4286 0.4286 
0.2857 0.2857 0.2857 
" 0.2022 0.2022 0 . 2022 " 
B t -> 0.3708 0.3708 0.3708 
0.4270 0.4270 0.4270 


或用有理数 形式： 

•2/7 2/7 2/7" 

# — 3/7 3/7 3/7 且 

2/7 2/7 2/7 

"18/89 18/89 18/89" 
B k -> 33/89 33/89 33/89 
38/89 38/89 38/89 


第 3 章 


3.1 

1.1 3.-5 5.-23 7.4 

9. 10, 从第 3 行开始. 

11.-12, 从第 1 列或第 4 行开始. 

13.6, 从第 2 行或第 2 列开始. 

15. 1 17.-5 

19. ad - be , cb-da , 交换两行改变行列式的符号. 
21. -2, （18 + 12 幻 -(20 + 12 幻 =_2 . —个行的替换 
不改变-个行列式的值. 


23. -5, k ( 4 )- k ( 2 ) + k (- l ) = - 5 k ,用一个常数灸乘 
一行后的行列式等于*乘以原行列式. 


25. 1 27. k 29.-1 


31. 1,矩阵是上三角形或下三角形形式，在对角线 
上只有 1. 行列式等于1，是对角线元素的乘积. 
33. det £4 = det[ C ^l = c 6 -arf = (- l ) ( ad - be ) 


35. 


37. 


= ( det £)( det ^ l ) 


det EA = det 


b + kd ~ 
d 


=(a + kc)d ~(b + kd)c 
=ad + ked - be - kdc = (+1) ( ad - be ) 
= ( det £) (det A ) 



; 否 


39 .在“学习指导”中有提示. 

41. 平行四边形的面积和 [« v ] 的行列式都等于6, 


如果对任何 x,v = 


x 

_ 2 _ 


面积仍为6,在每种情 


形下，平行四边形的底边没有改变，且高度保 
持为2，因为 v 的第二个坐标总是 2. 

43. [ M ]— 般地， det (4 + fi ) 不等于 detA + detfl . 

45. [ M ] 在学到 3.2 节时，你可以检査你的猜测. 


3.2 


1. 交换两行改变行列式的符号. 
3. 行替换变换不改变行列式. 


5. 3 7.0 


9.3 11.120 


可逆 

线性无关 


17.-7 19.14 

23. 不可逆 
27.见“学习指导' 


31. 

33. 

35. 


提示：证明 ( detZ ) ( det ^ r ' pl . 
提示： 用定理 6. 

提示： 用定理6和另一个定理. 


37. 


det AB = det 

= 24 



( detA ) ( detB ) = 3-8 = 24 
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39. 


-12 b . 500 


.64 


41. detA = (a + e)d ~(b + f)c = ad + ed - bc - fc 
=(ad - be ) + (ed - / c ) = detfi + detC 
43. 提示： 用第 3 列的余因子展开计算 det /1. 

45. [ M ] 在你做出关于 AM 和的猜测后参考 
“学习指导”. 

3.3 


y 关 ;七= 

y 关0 ，一1 ; x, = 


3/2 


55 + 4 
6(5 2 -3) 

1 

' 3(5 + 1) ’ 


5. 

_ - 45-15 
~ 4 ( 5 2 - 3 ) 
45 + 3 

65(5 + 1) 



_ 0 

1 O' 


_ 0 

1 O' 

adj/l = 

-3 

-I —3 


-3 

-1 -3 

1 

3 

2 6 」 

i 

_ 3 

2 6 



"-1 -1 5 


-1-1 

5" 

13. adjh 

1 -5 1 


1 -5 

1 


1 7-5 


L 1 7 -5」 


' 2 0 O ' 


' 2 0 O ' 


15. ad}A = 

2 6 0 

^■'4 

2 6 0 



—1—9 3 


—1-9 3 



17.如果4 = 


，那么 Cji = d y Ci 2 = — c , C 2 i 


= - b ， C 22 = a . 共轭矩阵是余因子的 转置： 

根据定理8,我们用 deM 来除，得到与 2.21! 
中-样的公式. 


19. 8 21.14 23. 22 

25 .—个 3 x 3 矩阵/!不是可逆的充分必要条件是 
它的列是线性相关 （ 由矩阵可逆定理）.这种 
情形出现的充分必要条件是其中一个列是在 
其他两列所生成的平面内，这等价于由这些列 
所确定的平行六面体具有零体积，也就是等价 
于条件 deM = 0 . 


27. 24 29. det [ v , v 2 ] | 

31. a . 见例 5 b . 4 nabc /3 
33. [ M ] 在 MATLAB 中， fi - inv ( zl ) 中的元素近似为 
nr 15 或更小，见“学习指导”的建议，它也许 
会节省你工作中的键盘输人. 

35. [ MJMATLAB 学生版 4.0 用57 771次浮算来计 
算 inv 04) 和14,269 045次浮算来计算求逆公式. 
inv (/ l ) 命令仅需要求逆公式中0.4%的运算量. 
“学习指导”给出如何使用 flops 命令. 


第3章补充习题 


a . T 

b . T 

c . F 

d . F 

e . F 

f . F 

g-T 

h . T 

i . F 

j.F 

k . T 

1. F 

m . F 

n . T 

o . F 

P-T 


习题2〜4的解基于这样的事实，如果一个矩 
阵包含两行（或两列）相互为倍数，那么由定理4, 
因为矩阵不可逆，矩阵的行列式为零. 

3. 做两次行替换变换且提出第2行的公共因子， 
和第3行的公共因子. 


1 a b + c 


1 a 

b + c 

1 b a + c 

= 

0 b-a 

a — b 

1 c a + b \ 

1 

0 c~a 

a-c 


1 a b + c 

= ( b - a ) ( c - a ) 0 1 -1 

0 1 -1 

-0 

5.-12 

7. 当行列式用第一行的余因子展开，方程具有形 
S ； ax + by + c = 0 ,此处 Z ) 和 c 至少有一个非零. 
这是一条直线的方程，很明显(々，>>,)和 0 c 2 ,>> 2 ) 
在直线上，因为当用其中一个点的坐标代人 ; c 
和; V 时，行列式的两行相等，于是行列式为零. 
1 a a 2 

9- T - 0 b~a b 2 - a 2 . 因此，由定理 3 
0 c-a c 2 ~ a 2 




奇数习题答案 


475 


detT = ( b - a ) ( c - a)det 


= ( b ~ a ) ( c - a)dei 


1 a a 2 


1 1 1 ... 1 

0 1 b-ha 


12 2 2 

0 1 c + a 

猜想： 

12 3 3 

\ a a 2 

1 


0 1 b + a 


1 2 3 ... rt 

0 0 c-b 

| 为肯定这个猜想，使用行替 


= { b - a ) ( c - a ) ( c - b ) 

11. 面积 =12. 如果从四个顶点减去一个顶点，记 
新顶点是0, v ,, v 2 和 v 3 ,那么变换后的图形 
( 因此原来的图形）是平行四边形的充分必要 
条件是在 v ,, v 2 , v 3 中，某一个是另外两个向 
量之和. 

13. 由求逆公式，4 = /，由可 

逆矩阵定理， adjZ 是可逆的，且 

(adj Ay 1 =-^~A . 
del A 


主元下面的零元素，然后再用第一个主元，如 
I 1 1 ■ 

0 1 1 

此类推，最终矩阵是0 0 1 l |, 是行列 

0 0 0 . 

式为1的上三角形矩阵. 


第 4 章 

4.1 


15. a . X = CA\Y = D - CA ~ i B . 现在利用练习 14( C ). 
b . 从 （ a ) 部分和行列式的乘积性质， 

de {g ^j = detU(£>-C^ *5)] 

= det[^-^C4 _, fi] 

= det ( AD ~ CAA 1 B ) 

= det ( AD ~ CB ) 

其中等式 AC = 在第三步中用到. 

17 - 首先考虑《 = 2的情形，通过直接计算 s 和 c 
的行列式来证明公式成立.现假设该公式对 
所有 （ A - l ) x ( A - i ) 矩阵成立，设和 C 是 
AxA 矩阵.使用按第一列的余因子展开和归 
纳假设来求 deW . 对 C 做行变换得到第一个 
主元下面为零元素的三角形矩阵.求该矩阵 
的行列式，然后加到 detfi 中得到最后结果. 

19. [ M ] 计算： 


2 2=1， 
2 3 


12 2 2 
12 3 3 
12 3 4 


2 2 2 2 
2 3 3 3 =1 
2 3 4 4 
2 3 4 5 


l . a . « + v 在 v 中，因为它的元素都是非负的。 
b . 例子:如果 m = J^|*c = -1 ，那么 m 在 V 中， 
但 CV 不在 V 中. 

3. 例子： 如果 K = 和 c = 4, 那么《在//中， 
但 CU 不在好中. 

5.是，由定理1,因为集合是 Span {? 2 }, 它是尸„的 
一个子空间. 


7.否，该集合对不是整数的标量乘法不封闭. 

9. W = Span { v } ，此处 v = 3 .由定理丨，孖是 f 
2 


的一个子空间 


11. W , = Span {«, v } ,此处 K = | ! 


,由定理 


LoJ LiJ 

1，撕是 R 3 的一个子空间. 

13 a - ( Vi ， V 2 ， V 3 } 中仅包含三个向量，且设不在其中. 
b . 在 Span ^. wJ 中有无穷多向量. 


c . 在 Span { vi ， v 2 ， v 3 } 中. 

15. 不是向量空间，因为零向量不在撕中. 
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19. 提示： 利用定理 1. 


注意尽管“学习指导”对每一个单数的这里 

的答案仅是“提示”的练习有一个完整解答，但你 

必须自己真正去求这些问题的解否则，你不能从 

习题中受益. 

21.是，对一个子空间的条件是明显满 足的： 零矩 
阵在 W 中，两个上三角形矩阵的和是上三角形 
矩阵，且任何一个上三角矩阵的标量乘法仍然 
是上 F 角形矩阵. 

23. 写出答案后，参考“学习指导” . 

25. 4 27. a. 8 b. 3 c. 5 d. 4 

29. m + (-1)m = 1m + (-1)m 公理 10 
= [l + (-l)]« 公理 8 

= 0« = 0 习题 27 

从习题 26, 得出 （-1)K = -K . 

31. 任何包含和 v 的子空间 // 必须包含 

的所有标量乘法，因而包含《和》所有标量乘 
法之和，于是//必须包含 Span{j«，v}. 

33. 提示： 对部分解，考虑 W + A ： 中的化和!^， 
并把 h >, 和 h > 2 分别写成 w x = u { + v l M 
w » 2 = k 2 + v 2 ，其中和《 2 属于//，而*^和*» 2 属 
于尺. 

35. [M ] 简化的 [v, v 2 v 3 叫阶梯形式表明 
w =7.5v, +3 v 2 +5.5v 3 . 

37. [M] 函数是 cos4r 和 cos6r ,见 4.5 节习题 34. 

4.2 


" 3 

-5 -3' 

「 1_ 


" o' 

6 

-2 0 

3 


0 

-8 

4 1 

.-4. 


0 


所以 **> 在 Nul/1 中. 


71「—6- 


3. 


-4 


2 

0 


0 


'2 


0 


5. 0 ， 9 


0 


0 I 0. 


7. 价不是 R 3 的一个子空间，因为零向量(0,0,0) 
不属于价. 

9. 州是 R 4 的一个子空间，由于州是下列方程组 
的 解集： 

a -2 b -4 c =0 

2 a - c - 3 d =0 

11 .价不是子空间，因为0不在价中， 验证： 如果 
一个元素+ + 是零，那么 

5 + d = 0 和3=0,这是不可能的. 

"I -6' 

13. W = Co \ A , 其中力= 0 1 ， 所以由定理3, 

1 0 


15. 


W 是一个向量空间. 
'0 2 3' 

1 1 - 2 

4 1 0 

3-1-1 


17. a.2 b.4 

21. [□在 NulA 中， 


19.a.5 b.2 

2- 

_1 在 Col 4中，其余答案可 


能. 

23. **> 属于 NulZ 和 ColZ. 

25.见“学习指导”，现在你应知道如何合理使用它. 



" 3" 


'1-3-3’ 

27. 令 x=| 

2 

和 A = 

i 

-2 4 2 
-1 5 7_ 


那么 x 属于 


NuM ,由于 NulZ 是 R 3 的一个子空间， 10x 属 


于 NuM. 


29. a. 40 = 0,所以零向量在 ColZ 中. 

b. 由矩阵乘法的性质， Ar + 如=4(> + **0 ， 它 
表明 Ar+ /!**> 是的列的线性组合，因此属 
于 CoM. 

c. = ，这表明对所有数 c ， c(Ar) 在 

Col 种. 

31. a. 对任何在炉 2 中的多项式 p， 9 和任何数 c ， 
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T(p+q) = 


( P + g ) (0)| 

(p + q) (1) 


'H: 


p(0) + q(0) 
P ⑴ + 9(1) _ 


T(p) + T(q) 


r ( d = < 


cT(p) 


所以 r 是一个从 p 2 到 p 2 的线性变换. 
b . 任何在 o 和 l 点为零的二次多项式必须是 
p ( r ) = r ( r - l ) 的倍数， r 的值域为 R 2 . 

33. a . 对属于 jWm 中的和任何标量 c ， 

T{,A + B ) = (A + B ) + (A + Bf 

= A + B + A t + B t 转置性质 
= (A + A t ) + (B + B t ) = T ( A ) + T ( B ) 
T ( cA ) = ( cA ) + ( cA) T =cA + cA T 
= c(A + A r ) = cT ( A ) 

所以 r 是一个从到的线性变换. 
b . 如果 S 是中任一元素且具有性质 
B r = B ,若 A = ^ B ， 那么 


7■⑷ 


= + =-B + -B = B 


c . ( b 廊分说明 T 的值域包含所有满足 = 

的 S ，所以，它充分说明任何在 r 值域中的 
s 有这个性质，如果 s = r (/ i )， 那么由转置 
性质， B t =(A + A t ) t = a t + a tt = a t + a = b 

d . ^ 的核是 实数 j 

35. 提 TK : 验证子空间的三个条件， r ( t /) 中的典型 
元素具有形式 r ⑷和 r ⑻） ，此处属于 [；. 
37. [ M]W 属于 CoM ，但不属于 Null (解释为什 

么？） 

39. [ M ] 4的简化阶梯形式是 

'101/30 10/3 

011/30 -26/3 
0 0 0 1 -4 

0 0 0 0 0 


4.3 

1 .是， 3 x 3 矩阵 4 = | 0 1 1| 具有 3 主元位置，由 

|o 0 

可逆矩阵定理， 

个基 •（ 见例 3.) 

3.否，向量线性相关且不能生成 H 3 . 

5.否，集合是线性相关，因为零向量在集合中， 
然而， 


是可逆且它的列构成 R 3 的一 


■1-2 

0 

0" 


"1 

-2 

0 

0' 

-3 9 

0 

- 3 


0 

3 

0 

-3 

0 0 

0 


| 

0 

0 

0 

5_ 


矩阵的每一行有主元，因而它的列生成 M 3 . 

否，向量是线性无关，因为他们不是倍数关系 
(更精确地讲，没有一个向量是其余向量的倍 
. 61 

数）.然而，向量不能生成 K 3 ，矩阵 


最多有2个主元，因为它仅有2列.所以， 
是每一行有一个主元. 

31… 


并不 


11 . 


13. Nul/1 的基: 


CoM 的基: 


"-6 " 


' -5 " 

-5/2 


—3/2 

1 


0 

0 


1 


15. { vwi } 17. [ M ] { v 1 , v 2 , v 3 } 

19. 3 个最简单的答案是 { v ^) 或 { v ,, v 3 ) 或 { v 2 ， v 3 }. 

其他答案也可能. 

21.见“学习指导”的提示. 

23. 提示： 利用可逆矩阵定理. 
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奇数习题答案 


25. 否.(为什么集合不是 W 的基？） 

27. { cosftM ， sin < M }. 

29. 设4是 nxjt 矩阵 [ v , … V *]，由于4的列少于 
行，不可能 A 的每一行有一个主元位置，由 
1.4 节的定理4, 4的列不能生成 R ' 因此不 
是 1 T 的基. 

31. 提示 :如果 { v ,,...,%} 是线性相关，那么存在不 
全为零的 c ,,...， c p ,使得狀+…+ ^一❶-利 
用这个方程. 

33. 任一多项式不是其他多项式的倍数，因此 
中的线性无关集. 

35. 设 { v ,， v 3 l 是向量空间 V 中的任一线性无关集， 
并设 V 2 ， V 4 是 V ,和 V 3 的线性组合，则 {VhVjS 
Span { v l ) v 2 , i > 3 , v 4 ) 的一组基. 

37. [ M ] 你可能很聪明且找出特殊？值使得 (5) 中的 
方程产生几个零，从而得到可以很容易用手工 
求解的线性方程组，或者，你可 利用？ 值，如 
t = 0, 0.1, 0.2, ••-,产生一个能用矩阵程序来解 
的线性方程组. 


4.4 


线性相关的，那么 [ Kl ] B ，…，是线性相关 
的.其次，说明如果[«山，…， [« P ] S 是线性相关 
的，那么《,，•••，《,是线性相关的，利用习题中 
显示的两个方程，一个稍微不同的证明在“学 


习指导”中给出. 

27. 线性无关 （ 验证习题 27-34 中的答案）. 
29. 线性相关 


31. 

a . 坐标向量 

r 

-3 

'-3' 

, 5 

'-4' 

，5 

r 

，0 



5_ 

-7 

-6 

-i 


不能生成 


R 3 . 因为 R 3 * P 2 同构，对应的多项式不 
能生成 P 2 . 



~0" 

1" 

'-3' 

" 2 


b . 坐标向量 

5 

，一 8 

， 4 

，— 3 

生成 R 3 . 因 


1 

_2 

_ 2_ 

0 


为 R 3 * P 2 同构，对应的多项式生成 P 2 . 


「3 _ 

_ 5~ 

" 0' 

1 


[ M ] 坐标向量 

7 

1 

，0 

1 

’ -2 

16 

是 R 4 中的 


0 

，-6 


0 

-2. 

0 

_ 2 



线性相关子集.因为《 4 和朽同构，对应的多项式 
构成 P 3 的线性相关子集，因此不能构成 P 3 的基. 




'-f 

- 5 i 

5- [ 1 \ 7. 

[: I ! 

35 肩叫： 1 

37. [M] 

"1.3' 

0 


1_- 5 」 

U 」 

L 0/J 」 


0.8 




4.5 

rn r-2* 


15. “学习指导”有提示. 

17. [: h -2 v 2 =10v,-3v 2 +v 3 (无穷多解答）. 

19. 提示： 由假设，零向量可惟一表示成 S 中元素 
的线性组合. 


21 . 


"9 

4 


23. 提示： 若 [«] b =[ h 0 s 对 V 中一些“和…成立， 
且记 [«<] s 中的元素为.利用 [ j «] b 的定义. 
25. —个可能的方法：首先，说明如果&心是 


维数是 2. 


:维数是 3. 


维数是 2. 


7.没 有基； 维数为零. 9.2 


11 . 2 




奇数习题答案 
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13.2, 3 15.2, 2 17.0, 3 19. 见“学习指导”. 

21. 提示： 你只需验证前4个埃尔米特多项式是线 
性无关，为什么？ 

23 .[ p ] B =〔3, 3, -2,吾) 

25. 提示： 若 S 确实生成 V ,且用生成集定理，这 
会导致一个矛盾，从而证明生成假设是错的. 

27. 提示：利用每一个 P , 是 P 的一个子空间的事实. 

29. 验证每一个 答案： a . 真， b . 真， c . 真. 

31.提 示： 由于 W 是有限维空间的一个非零子空 
间， W 是有限维的且有基，如 v u ...， v p , 首先 
证明 { ro ^ v . srov )} 生成 r (//). 

33. [ M ] a . —个基是 {wywj ,事实上， 
e 2 ，…， e 5 中的任何两个向量可将 h ， v 2 , v 3 } 扩展 
成为 M 5 的一个基. 


7 .是； 不是.由于 Col A 是 R 4 的一个4维子空间， 
它和 R 4 —致，它的零空间不是 M 3 , 由于 Nul 
中的向量有7个元素.由秩定理 ， Nul 4是 R 7 中 
的一个三维子空间. 

9. 2 11.3 

13.5,5. 在这两种情形，主元的个数不能超过列数 
或行数. 

15.2， 17.见“学习指导”. 

19.是，在査阅“学习指导”之前，试给一个解释. 
21.否，解释为什么. 

23.是，仅需要6个齐次线性方程组成的方程组. 
25.否，解释为什么. 

27. Row 4和 Nul 4属于 R" ， Col 4和 Nul 
属于 R m ， 仅有4个不同子空间.因为 
Row A T = Col 4 和 Col /1 t = Row A . 


4.6 


A = 2; dim Nul A = 2; 


Col 4的 基为： 

r 

-i 


'-4' 

2 

Row A 的 基为： 

_ 5_ 

(1,0 

_ 

-6 

1,5) 

Nul / I 的 基为： 

_ 1 

5/2 


'-5' 

—3 




0 


0 - 


1 


3. rank .4 = 3 ; dim Nul A = 2; 


" 2" 


' 6' 


' 2 

-2 


-3 


-3 

4 


9 


5 

-2_ 


3 


-4 


Col / I 的基： 

Ro “ ： （2，-3,6,2,5)，(0,0,3，- l ， l )，(0,0,0， l ，3) 

Nul A 的基： 


~3/2' 


' 9/2 



0 

0 


-4/3 

0 


—3 

0 


1 


29. 记住若 Col /I = R m 时，精确地有 dim Col A = m , 
或等价地，对所有 6 方程相容.由习题 
28( b ), 当 dim Nul /1 T =0 ,精确地有 Col A = m , 
或等价地，方程 / l T x = 0 只有平凡解. 

" 2 a 2 b 2 c 

31. uv T = -3 a -3 b -3 c , 所有列是“的倍数， 

5 a 5 b 5 c 

所以，除非 fl =6 = c = 0 ，Col mv t 是一维的. 

33. 提 7 K :设 ■/! = [M M 2 M 3 ] ，如果 M 矣 0 ，那么 M 是 
Col A 的一个基，为什么？ 


35. [ M ] 提示： 见习题28和例4之前的论述. 


4.7 


1. a . 

1 






r 4 

-1 0" 


Y 

5. a . 

一 1 

l l 

b . 

2 


^ 0 

1-2」 


_2_ 



3. ⑼ 
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11.见“学习指导' 



1 3 O ' 


' 5" 

13. p = 

C.*-B 

-2-5 2 

1 4 3 

， [-l + 2 r] B = 

-2 

1 


15. a . S 是 V 的一个基. 


b . 坐标变换是一个线性变换. 

c . 一个矩阵和一个向量的乘积. 

d . v 相对于 S 的坐标向量. 

17. a . [ M ] 

「32 0 16 0 12 0 10' 

| 32 0 24 0 20 0 

16 0 16 0 15 

8 0 10 0 

4 0 6 

2 0 
1 

b . 尸是从 C 到 S 的坐标变换矩阵，根据方程 
(5), 所以尸 1 是谷到 C 的坐标变换矩阵.由 
定理15,这个矩阵的列是 S 中基向量的 C - 
坐标向量. 

19. [ M ] 提示： 设 C 是基 { vwj , 那么尸的列是 
和 [« 3 ] c .利用 C - 坐标向量的定义和 
矩阵代数计算解法在“学习指导” 
中有讨论.这里有数值 解答： 



-6" 


.-6 — 


'-5' 

a . Mi = 

-5 

,»2 = 

_9 

， M 3 = 

0 


21 


[32」 


3 



" 28 


' 38' 


" 21 

b . = 

-9 

, w 2 = 

-13 

= 

-1 


-3 


2 


3 


4.8 

1. 如果 h = 2* ，那么如= 2* +1 且> +2 = 2*+ 2 ， 将这 
些公式代人方程左边 得到： 

y M + 2y M -iy k =2 k ^ + 2-2 M -%-2 k 
= 2 *( 2 2 + 2 - 2 - 8 ) 

= 2*(0) = 0 ( 对所有 it ) 

由于对所有差分方程成立， 2 1 是一个解， 
同样的计算对 y »=(-4) 1 成立. 


3. 信号 2* 和 (-4)* 是线性无关，由于没有一个是另 
外一个的倍数.例如，不存在数 c 使得 
2* =<-4/ 对所有 （ 成立.由定理17，习题1 
中差分方程的解集 W 是二维的，由 4.5 节的基 
定理，两个线性无关的信号和(-4) 1 形成 W 
的一个基. 

5. 如果凡=(-3)*，那么对所有灸，有 

y ^+ 6 y M +9 y k = (-3广 2 + 6(-3 ) w + 9(-3)* 
=(-3)*[(-3) 2 + 6(-3) + 9] 

= (-3)* (0) = 0 

类似地，如果％=軾-3)\那么对所有有 
細 +6 y M +9 y k 

= (k + 2)(_3 广 2 + 6 (it + 1)(-3)*+'+ 9 k (-3 ) k 
=(-3 ) J [(jt + 2) (-3) 2 +6 (jt +1)(-3)+ 9) t ] 

= (-3)*[9 it + 18-18 jt -18 + 9 jt ] 

= (-3)*(0) 

这样， （-3/ 和 M -〗) 1 都是在差分方程的解空间 
W 中.而且，没有数 c , 使得 Jt (-3)*= c (-3 )*S 
所有) t 成立，因为 c 的选取必须与 it 无关.同样， 
没有数 c 使得 （-3)*= ot (-3)*^ 所有 it 成立，所 
以两个信号线性无关.由于 dim // = 2, 由基定 
理，信号形成 W 的一个基. 

7.是 9.是 

11.否，两个信号不能生成三维解空间. 



17. }；=^(0.8)*+^(0.5)*+10^10 ,当 jt — oo 时 
19. y t = Ci (-2 + S) k + c ^-2- S) k 
21. 7,5,4,3,4,5,6,6,7,8,9,8,7,见下图. 



0 i t t t S S fr* 

23. a. y* +1 -1.01y t =-450, y„=10 000 

25.jt 2 +c,-(-4) t +c 2 

27. 2 — 2 .k + C \ *4* + c *2.2 _ * 
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29. x, +l = Ax k ,此处 


0 I 0 0 


: y * 

0 0 10 


: y*+i 

0 0 0 1 


: y * +2 

9-6-8 6 




31. 方程对所有成立，所以其中 it 用 （ it -1) 替换， 
可将原方程 变为： 

v * + 2 + 5. v i+ i + 6; y * = 0对所有众成立 
方程是2阶的. 

33. 对所有灸， Gasorati 矩阵 C ( it ) 不可逆，在这种 
情形， Gasomti 矩阵没有给出信号集合线性无 
关和线性相关的信息.事实上没有一个信号是 
其他信号的倍数，所以它们线性无关. 

35. 提示： 验证定义线性变换的两个性质，对 S 中 
的{%}和 { Z *}， 研究 r ({> u } + { Zt }) ，如果 r 是 
任意数， 那么/ •{&} 的第 it 项是 a ;因此 
r ( r {>> t }) 是序列{叫},由下式 给出： 
w * = ry k +2 + a ( ry M ) + b ( ry k ) 


4.9 


从新闻乐 到 
1. 「0.7 0.6"| 新闻 

& 0.3 0.4 j 音乐 

从健康疾病到 
3. ("0.95 0.451 健康 

a ' [0.05 0.55_| 疾病 


c . 0.925; 使用 




b . 15%, 12.5% 



"1/4" 
7. 1/2 
1/4 


9.是，由于尸 2 都具有正元素. 


il . a . 

13. a . 


■2/3] 

-1/3」 

"0.9 l 

o-ij 


b . 2/3 

b . 0.10, 否 


15. [ M ] 大约 13.9% 的美国人口. 

17. a . 尸的一个列的元素之和为1，矩阵尸 -/ 中 


一个列具有与 P 同样的元素，除了其中一个 
元素减了丨，因此每一列的和为 0. 

b . 由 ( a ), Z 3 -/ 的最后一行是其他行之和的相 
反数. 

c . 由 ( b ) 和生成定理，尸-/的最后一行可以删 
去，而剩下的 ( n -1) 行，仍然生成行空间.另 
一种方法，利用 ( a ) 和行变换不改变行空间的 
事实，取 A 是 P -/ 将其他行加到最后一行 
的矩阵，由 ( a )， 行空间可由/ I 的前 ( n -1) 行 
所生成. 

d . 由秩定理和 ( c ), 尸-/的列空间的维数小于 
n ,因而它的零空间是非平凡的.你可以不 
用秩定理，而用可逆矩阵定理，因为 P -/ 是 
一个方阵. 

19. a . 乘积&等于 x 中元素之和，对一个概率向 
量，这个和一定等于 1. 

b . 尸 = [；>, p 2 … p „] ,此处 p , 为概率向量，由 
矩阵乘积和 ( a )， 

SP = [ Sp , Sp 2 --- Sp „] = [l 1 ... 1] = S 

c . 由 ( b )， S(Px) = (SP)x = Sx = l ,同样 ftc 中的 
元素是非负的(由于尸和 x 具有非负元素)， 
因此，由 ( a ), / It 是一个概率向量. 


第4章补充习题 


a . T 

b . T 

c . F 

d . F 

e . T 

f.T 

g.F 

h . F 

i . T 

j.F 

k . F 

1. F 

m . T 

n . F 

o . T 

P-T 

q.F 

r . T 

s . T 

t . F 


3. 所有 (hAA) 的集合， MSib l +2b 2 +3b 3 =0 . 

5. 向量巧不是零， p 2 不是妁的倍数，因此保留 
这两个向量.由于 p 3 =2 p ,+2 p 2 ，排除 p 3 .由于 
；> 4 有》 2 项，它不可能是 PuR 的线性组合，故 
保留 p 4 . 最后 Rzpi + A ， 故排除 p 5 . 结果基 
是 { Pi ， P 2 ，/ M . 

7. 齐次方程组的解集是由两个解生成的，在这种 
情形下， 18x20 的系数矩阵 /I 的零空间最多是 2 
维.由秩定理 dimCol 4 彡 20-2 = 18 ， 这说明 
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Col A = R ' 8 ,因为 A 有18行且每一个方程 
是相容的. 

9. 设 A 是线性变换 r 的标准的 mxn 矩阵. 

a . 如果 T 是一对一映射.则 A 的列向量线性无 
关 (1.9 节定理 12). 因此 din » NulA =0 .由秩定 
理 ， dimColA = rankA = n .因为7■的值域是 
ColA , 7的值域的维数是”. 

b . 如果 r 是满射，则 A 的列向量生成 R m (1.9 
节定理 12), 所以 dimCd A = m .由秩定理， 
dimNuli 4 = n-dimCoIA = «-m .因为 r 的核 
是 NuM , 7的核的维数是 n - m . 

11. 如果 S 是 V 中有限的生成集，那么 S 的一个子 
集，如 S ', 是 V 的一个基.由于矿一定生成 V ， 
矿不能是 S 的一个真子集，因为 S 是最小的， 
这样，从而证明 S 是 V 的一个基. 

13■由习题9, rank PA ^ rank A , rank A = rank 

p -'( W)^rank PA 于是 rank PA = rank A . 

15. 方程 Afl = 0 说明 fi 中的每一列属于 NulA . 由 
于 NulA 是子空间， fi 的列的所有线性组合都 
属于 NuM , 因此 Col B 是 Nul A 的子空间.由 
4.5 节定理 11, dimColB ^ dimNulA . 应用秩 
定理，得到 

n = rank A + dim Nul rank A + rank 忍 
17. a . 设 4 由 A 的 r 个主元列组成 ，4 的列是线性 
无关，所以，4是秩为 r 的 mxr 阵. 
b . 将秩定理应用于4 . Row 4的维数是 /* , 
所以4 有/ •个线性无关的行.利用这些行 
构造 A 2 , 那么恚是/0</•的，且有线性无关 
的行.由可逆矩阵定理， A 2 是可逆的. 

0 1 0 ' 

19. [B AB A 1 B \= 1 -0.9 0.81 
1 0.5 0.25 

1 -0.9 0.81' 

- 0 1 0 
0 0 -0.56 

这个矩阵的秩为3,所以 （ A , B ) 是可控制的. 

21. [ M ] rank(B AB A 2 B A 3 B ) = 3, 不可控制. 


第 5 章 


5.1 



-2] r-3' 

15. 1,0 17.0, 2, -1 

oj [ 1. 

19. 0. 验证你的答案. 

21. 写出答案之后，见“学习指导”. 

23. 提示： 用定理 2. 

25. 提示： 利用方程 Ac = Ax 找出包含 / T 1 的方程. 
27. 提示: 对任何 MA -； l/) T = A T -； l / ,由定理 
(哪一个？）可逆的充分必要条件是 
A - A / 可逆. 

29. 设 v 是 R " 中向量，其元素全是丨，那么 Ak = jv . 
31. 提示：如果 A 是 r 的标准矩阵，找一个非零向 
量 V (平面上一点)使得 Av = v . 

33. a . je ttl = + Cifl k *'v 

b . Ax k = A ( ciX l u + c 2 # l 4 v ) 

=cXAu + c 2 fi k Av 线性性质 

= c,X k ht+c2ti l Hv h 和 v 是特征向量 

=x M 





奇数习题答案 



5.2 

1. A 2 —4 A -45 ; 9, — 5 3. A 2 -2 A -1 ; 1± V 2 

5. A 2 -6 A + 9 ; 3 

7. A 2 -9 A + 32 ; 无实特征值 

9. - A 3 +4 A 2 -9 A -6 ll .- A 3 +9 A 2 -26 A + 24 

13. - A 3 +18 A 2 -95 A + 150 15.4， 3，3， 1 

17.3， 3，1， 0 

19. 提示： 方程对所有 A 成立. 

21 .见“学习指导”的提示. 

23. 提示：求一个可逆矩阵 P ， 使得 = 

25. a . {vyd ,此处 v 2 是对应 A = 0.3 的特征 
向量. 

. 1 
b . Xq = Vi v 2 . 

14 

C . ■ tl=V|- ^ 0 - 3 ^ 2 - ^2=* , i -^(0-3) 2 V2 , x k = 

v ,-1(0.3)* v 2 .当 hoc 时 ，（0.3)*—0, 所 
14 

以 X * —> Vj . 

27. a . Av , = v ,, Av 2 =0.5 v 2 , Av 3 =0.2 v 3 .( 这也证明 A 
的特征值为 1, 0.5 m 0.2.) 
b . { v ,， v 2 , v 3 } 线性无关，因为特征向量对应于 
不同的特征值（定理 2) .由于集合中包含 
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三个向量，集合是 R 3 的一个基.所以存在 
(惟一)常数使得 X 。=£^+£^+£^3 ,那么 
» ,T Xo = CiW T Vi + c 2 w t v 2 + c,w T v, (*) 

由于知和〜是概率向量，且》> 2 和》>,的元素 
之和为0, (*) 表明 l = Cl . 
c . 由 ( bXxpi ^+ cA + cA . 利用⑻， 
x t = A k x 0 = A * v , + c 1 A k v 1 + c i A k v i 
= v 1 + c 2 (0.5) t v 2 + c 3 (0.2) t v 3 
，当 * -»oo 

29. [ M ] 报告你的结果和结论，如果使用“学习指 
导”中讨论的 gauss 程序，你可避免复杂计算. 
5.3 

226 -525] [ a 4 0] 

90 -209 J '[3( a 4 -^) b k \ 



当一个答案包含一个对角化时， A = PDP ' , 
因子 P 和£>不惟 一， 所以你的答案也许与这里给 



9. 不能对角化 

—1 2 1] f 3 0 O ' 

11. P = 3 3 1 , D = 0 2 0 

4 3 1」 [o 0 1 

-1 2 ll ("5 0 O ' 

13. P = -1 -1 0 , £)= 0 1 0 

_ 1 0 lj l_o 0 1_ 

-1 -4 -2] ("3 0 O ' 

15. P = 1 0 -1 ,£)=0 3 0 

0 1 1」 1_0 0 1 — 

17. 不能对角化. 
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21.见“学习指导” 

23. 是.（解释为什么？） 

25 .否， A — 定可以对角化.（解释为什么？） 

27. 提示： ^A = PDP ' ,由于 A 是可逆， 0 不是 A 
的特征值，所以，£>在对角线上有非零元素. 
29. 一个答案是它的列是对应 A 特 
征值的特征向量. 

31. 提示： 构造一个合适的 2 x 2 三角形矩阵. 

33. [ M ] 

'2 2 1 6] [5 0 0 0* 

p _ 1-11 -3 d _ 0 1 0 0 

_ -1 - 7 1 0 ’ ~ 0 0 -2 0 

2 2 0 4_| L ° 0 0 - 2 . 

35. [ M ] 

" 6 3 2 4 3" 

一 1 -1 -1 -3 -1 

P = -3 -3 -4 -4 , 

3 0—150 

0 3 4 0 5 

*5 0 0 0 O ' 

0 5 0 0 0 

0 0 3 0 0 

0 0 0 1 0 

0 0 0 0 1 

5.4 

3-10] 

-5 6 4] 

3. a . T ( e \) = ~ b 2 by , T ( e 2 ) — ~ b \ — b ^ , T { e ^) = b \ —bi 



5. a . 10-3 f + 4 f 2 +/ 3 

b . 对任意属于 P 2 & p，g 和任意数 c ， 

Itp W + 扒 0] = (t + 5)[ p ( t ) + q ( t )] 

= (f + 5) p ( f ) + (f + 5_ 

= T [ p ( t )]- bT [ q ( t )] 

Tic - p ( t )] = (t + 5)[ c - p ( t )] = c(t + 5) p ( t ) 

= c - T [ p ( t )] 

'5 0 O ' 

1 5 0 
C 0 1 5 
0 0 1 
"3 0 O ' 

7. 5-2 0 

0 4 1 

"2 

9. a . 5 
8 

b . 提示：对任意 P 2 中的 pw 和任意数 C , 计算 
r ( p + 9 ) 和 r ( c . p ). 



17. a . Ab t =2 b ,, 所 以私是 A 的特征向量，然而， 
A 仅有一个特征值 ， A = 2, 且特征子空间 
仅是一维的，所以， A 不可对角化. 



19. 由定义，如果 A 与 S 相似，存在一个可逆矩阵 
P , 使得 P 'AP = S .( 见 5.2 节 .) 那么 S 是可逆 
的，因为它是可逆矩阵的乘积.为证明 V 与 
S - 1 相似，利用方程见“学习指导”. 
21. 提示： 复习练习题 2. 

23. 提示：计算 

25. 提示：写出，且利用迹的 
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性质. 

27. 对每一个 y, I ( bj)=bj ,由于] fT 中任意向量的 
标准坐标向量恰好是向量自身， [/(i；)] e =bj , 
/相对于 B 和标准基^的矩阵简单表示为 
[6, b 2 -bj .这个矩阵就是 4.4 节定义的坐标变 
换矩阵 ft. 

29. 恒等变换的 B 矩阵是/„，因为第）个基向量 
沁的 B 坐标向量是/„的第）列. 

-7 -2 -6' 

31. [M] 0-4-6 

0 0-1 


5.5 



7. 又=>/5±1,(?) = 71/6弧度 ， r = 2 

9. A =」^±(l/2)i，<p = — 5兀/6 弧度， r = l 

11. A = 0.1±0.1 i，<p = -Jt/4 弧度， r = V 2/10 

在习题 13~20 中，其他答案也有可能•任何 P ， 
使得 P ' AP 等于给定的 C 或 C T 的都是可满足的答 
案.首先求然后计算 



23. (a) 共轭的性质和等式 i T =x T . 
(b ) Ax = Ax 且 A 是实的； 


(c) 由于 x T Ai 是一个数，因而可认为是一个 


1x1 矩阵. 

(d) 转置的性质. 

(e ) A T = A , q 的定义. 

25. 提示： 首先写 ax = Rex + i(Imx) 


27. [M] 


P- 


' 1 - 1-2 0 " 
4 0 0 2 

0 0-3-1 

2 0 4 0 


'0.2 -0.5 0 0 ' 

0.5 0.2 0 0 

0 0 0.3 -0.1 

0 0 0.1 0.3 


其他选择也是可能的，但 C 必须等于广 1 AP. 


5.6 

1. a. 提示： 求 q，c 2 , 使得利用这 
个表达式和事实 v,*v 2 是 A 的特征向量，计 


b. —般地’ x* =5(3)*V! -4^ij v 2 ^ 对 C 0 . 

3. 当 p = 0.2，A 的特征值为 0.9 和 0.7, 且 
^=^(0.9)^|| + ^(0.7) 4 ^^0 ,当 时 

捕食者的出生率越高，猫头鹰的食物供应就越 
少，最后捕食者和被捕食者的数量都会消失. 

5. 如果 p = 0.325, 特征值是 1.05 和 0.55, 由于 
1.05>1,两种数量每年会增加5%,对应 1.05 的 
特征向量为 (6,13), 所以，最后每13000只松鼠 
大约有6只斑点猫头鹰. 

7. a. 原点是鞍点，因为 A 的特征值的绝对值一个 
大于1,另一个小于 1. 

b. 最大的吸引方向是特征值1/3对应的特征向 
量 v 2 , 所有是 v 2 倍数的向量都被吸引到原 
点，最大的排斥方向由特征向量 V, 给出，所 
有^的倍数都被排斥. 

C . 见“学习指导”. 
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9. 鞍点， A 的特征值2, 0.5; 最大的排斥 方向： 
通过 (0,0) 和 (-1,1) 的直线.最大吸引方向，通过 
(0,0) 和 (1,4) 的直线. 

11. 吸 引子； 特征值： 0.9, 0.8; 最大吸引 方向： 
通过 (0,0) 和 (5,4) 的直线. 

13. 排 斥子： 特征值1.2, 1.1; 最大排斥方向，通 
过 (0,0) 和 (3,4) 的直线. 



* 2 


-1" 

15. = v 1 +(0.1)(0.5 ) t 

-3 
■ !」 

+ (0.3)(0.2) 4 

0 

1 


k — 


b . 数量会增加，因为 A 的最大特征值是1.2,此 
值数值上大于1.最后的出生增长速度为1.2, 
即每年增加20%.对应特 征值人 =1.2 的特征 
向量是(4,3)，说明每3个成人将有4个儿童. 

c . [ M ]5 或6年以后，儿童一成人的比率会变 
得稳定，“学习指导”描述如何构造一个矩 
阵程序去生成一个数据矩阵，它的列给出每 
年儿童和成人的数量，数据的图像也有讨论. 

5.7 

' _册册 

3--吾 [ m ， 原点是鞍点 ，最大吸引 

方向是通过 (- U ) 和原点的直线.最大排斥方向 
是通过 (-3,1) 和原点的直线. 

5- 4⑴ e 4 ' + H 6 ', 原点是一个排斥子，最大 
排斥方向是通过 (1,1) 和原点的直线. 

7 .令 P = G I ]和 ^* = 1^ ^|，那么 A = ™ 厂 1 ，将 

太二/^代人 〆 。/^，我们有 

^-( Py ) = A ( Py ) 
at 

Py ' = PDP '( Py ) = PDy 


用 P — 1 左乘，得到/ = £( y 或 

r^wl = [4 oi 卜 (，)"| 

L/zwJ L° 6 J 

9. (复数 解）： 

彳 1 勹， 2 〜 2 [卞卜 

( 实数 解）： 


+ c 2 



e - 21 


轨迹是螺旋趋于原点. 


11. (复数 解): c |- 3 + 3 i j e 3 i ， + c ^- 3 - 3 i j e -3 i . 
(实数 解）： 

「-3 cos 3 卜 3 sin 3f "I f-3sin3f + 3cos3f1 
Cl |_ 2cos3f J + C 2 [_ 2sin3f J 

轨迹是绕原点的椭圆. 

13. (复数 解): c -[ 1 2 i ] e (1+3 i ，，+ c { 1 2 i ] e<1 " 31>， 

( 实数 解）： 

[ cos3/-sin3fl ( Fsin3/ + cos3f], 

2cos3, J e+C2 [ 2sin3, f 
轨迹是螺旋远离原点. 



-1" 


-6' 


-4 

15. [ M ] x ( f ) = c , 


e ~ 2 '+ c 2 


e _, + c 3 

1 

4 


原点是鞍点， c 3 =0 的解被吸引到原点， 
Cl = c 2 =0 的解被排斥. 

17. [ M ] (复数 解）： 


"-3" 

i 

e’ +c 2 

23-341' 

-9 + 14i 

e (5+21,, +c 3 

23 + 34i~ 

-9-14i 

e (5 - 2i), 

ij 


3 


3 



( 实数 解）: 


f 23 cos 2/ + 34 sin 2 t 


叫 




1 e ( + c 2 -9 cos 2 f -14 sin 2 r e 5 *+ 
lj [ 3 cos 2 / 」 

23 sin 2 t - 34 cos 2 / 

-9 sin 2 r + 14 cos 2 / e 5/ 

3 sin 2 / 
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原点是排斥子，轨迹是螺旋外出，远离原点 • 

—[1 IP 
翁 

2 UMMH ， 


5.8 


特征向量: 
A « 4.9978 


.0.3325]' 或 M =1 ; 


3 .特征向量：彳 r ， 或 h = 


A« 0.9075 

n=tt 7999 H^3 細卜讎 

ro.75] r 1 1 [0.99321 [ 1 1 

7 [M] ^{, J'[o.956 5 J'[ 1 J'[o.999oJ' 


队 ：11.5， 12.78， 12.96，12.9948，12.9990 

9. [ M ]/ z 5 =8.4233 ，队 =8.4246; 实 际值： 8.42443( 精 


确到小数点后5位). 

11. 叫: 5.8000,5.9655,5.9942,5.9990(^ = 1, 2, 3,4); 

R ( x t ): 5.9655,5.9990,5.99997,5.9999993 
13.是，但序列也许收敛非常慢. 

15. 提示： Ax-ax = { A - al ) x ,且用事实，当 a 
不是 A 的特征值时， （ A - a /) 是可逆的. 

17. [ M ] vo = 3.3384, V , =3.32119 (用四舍五人精确到 
4位有效数字）， v 2 =3.3212209 ,实 际值： 
3.3212201( 精确到小数点后7位). 

19. [ M ] a . / z 6 =30.2887 = 4 到四位小数，若到6位， 
最大特征值是 30.288685, 特征向量 
为 (0.957629, 0.688937, 1, 0.943782). 
b . 逆幂法（取 a = 0) 得到从― 1 =0.010141， 
//-' =0.010150 ，若到7位数字，最小特 
征值是 0.0101500, 且特征向量是 


(-0.603972, 1,-0.251135, 0.148953) •收 
敛速度很快的原因是第二小的特征值接 
近 0.85. 

21. a . 如果 A 的特征值在数量上都小于1且 

那么对充分大的 A 趋于一个特征向量 • 

b . 如果主特征值是1，且 x 具有与对应特征向 
量方向一致的分量，那么 M 4 x } 将收敛于那 
个特征向量的倍数. 

c . 如果 A 的特征值在数量上都大于1，且 X 不 
是一个特征向量，那么从到最近特征向 
量的距离在 400 时会增大. 


第5章补充习题 




1 . a . T 

b . F 

c . T 

d . F 

e . T 

f . T 

g.F 

h . T 

i . F 

j-T 

k . F 

1. F 

m . F 

n . T 

0 . F 

P-T 

q.F 

r . T 

s . F 

t . T 

u . T 

v . T 

w . F 

x . T 


3. a . 假设 /Ut = ；U 

, 其中 x ^=0 

’则 （5/_ A)x = 

5 x - 

- Ax =5 x - 

Xx =(5- X)x 

，特征值是 5- A . 


b . (51-3A + A 2 )x = 5x -3Ax + A(Ax) =5x-3Xx 
+ X 2 x = (5-3X + X 2 )x , 特征值为 5 — 3 A + A 2 . 

5. 令 x 是特征值 A 对应的特征向量，那么 
p ( A)x = (c 0 / + c,i4 + c 2 A 2 + ••• + c„A")x 
= c 0 at + q (/lx) + c 2 A 2 at + …+ c„ 

= c 0 x + c , Ax + c 2 A 2 x + • • • + c „ A"x = p ( A)x 
所以， p ( A ) 是 〆 A ) 的一个特征值. 

7. 如果 A = TOP ' 那么 p(A) = Pp(.D)P ' , 像习题 
6 中所证明，如果£>中（_/，_/)位置的元素为 A , 
那么 D * 中 （ j ，）) 位置为 .所以， p ( D ) 中 UJ) 
位置的元素为 〆 A ). 如果 p 是矩阵 A 的特征多 
项式，那么对 D 的对角线每一个元素有 
p ( A ) = 0, 因为 D 中的这些元素是 A 的特征值， 
于是 P ( D ) 是零矩阵，从而/^) = ?.0.广=0. 

9. 如果 /- A 不可逆，那么方程将会有 


一 个非平凡解，从而 x -/4 x = 0 且 /4 x = l_x ， 这 
表明 A 具有特征值 1. 如果所有特征值小于1, 
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这是不可能出现，所以—定可逆. 

10. 提示： 令~是/的列，根据 / T 的包含 A 的特征 
向量的一个基写出且证明当; — 时， 
A k ej —0,另一种方法是利用 A 的对角形研究 A *. 

11. a. 取《中的X，那么对一些数量 c 有 x = «< , 

所以 /Ut = A ( cu ) = c ( Au ) = c ( Ah ) = ( cA )« , 这说 
明 /Ut 在 《 中. 

b. 令 x 是中的非零向量，由于是一维 
的，尤是 x 的所有倍数形成的集合，如果尤 
在 A 之下不变，那么 /Ut 属于尤，因此如是 
X的倍数，那么 x 是 A 的一个特征向量. 

13. 1，3，7 14.-1, -1, -5 

15. 将第3章补充习题16的行列式公式中的^用 
a-A 替换： 

det(A - Xl ) = ( a - b ~ A 广 , [a ~X + { n -\) b \ 

这个行列式为零当且仅当£1^ = 0或 
fl-A + ( n - l ) i > = 0 .于是 A 是 A 的特征值当且 
仅当 A = a - t 或 X = a + ( n - l)b .从上 面计算 
det ( A - A /) 的公式得到特征值 a - fc 的重数是 
n~l ,特征值 a + ( n - l ) fc 的重数是 1. 

17. det(A - XI ) = (a,, - A)(a 2 2 - A) - a n a 2l = 

又 2 _(flii +«22 )A + (a,,a 22 - a l 2 a 2 i ) 

= A 2 -(trA)A + detA 

利用二次求根公式求得特征方程的解为： 
trA±^/(trA) 2 _4detA 
2 

特征值都是实数当且仅当判别式是非负的，即 
(trA) 2 -4detA>0 .这个不等式简化为 
(tr0 4 det/^p^j >deM . 

19 . Cp= [^ 6 5]' det(Cp — A/ ) = 6 -5A + A 2 = p ( X ) 

21. 如果 P 是一个次数为 2 的多项式，那么类似习 
题19中的一个计算表明：（^的特征多项式是 
P(A) = (-l) 2 p(A), 所以，对„ = 2结果是真的， 
假若结果对 n = 是真的，且考虑一个次 

数为 0 + 1) 的多项式 P . det(C p -A/) 按第一列 


的余因子展开， G - A / 的行列式等于 
「-A 1 0 I 


(- A)det ^ 


j +(- 1广、 
—02 … — a k —X 


显示的 Ax /: 矩阵是 c ,- A / ，此处 
9(0 =屮+ a 2 f +…+ a k t k ~' + f * • 由归纳假设，行列 
式 C p - A / 是 (-1)、( A ) ，行列式 


det ( C p - A /) = (- l ) t +1 a 0+ (- A ) (- l )^( A ) 

= (-l) t+1 [ao + A(a, + …+ a^-'+A 4 )] 

= (- l ) w P ( A ) 

所以，当 n = 结论成立时，公式对 n = fc + l 成 
立.由归纳法原理，关于 det ( C p - A /) 的公式对 
所有成立. 

23. 由习题 22, 范德蒙德矩阵 V 的列是 C p 的特征 
向量，对应的特征值分别是;^，烏 , A (特征多 
项式 P 的根），由于这些特征值是不同的，由 
5.1 节定理 2, 对应特征向量形成一个线性无 
关集.于是 V 有线性无关的列，且由可逆矩阵 
定理可知 K 是可逆的.最后，由于 K 的列是 C p 
的特征向量，对角化定理 （ 5.3 节定理 5 ) 表明 
V — 匕，是对角形. 


25. [ M ] 如果你的矩阵程序用迭代方法而不是符号 
计算法计算特征值和特征向量，你可能遇到一 
些困难.你会发现 AP-PD 有非常小的元素且 
TOP - 1 接近于 A . (这在几年前是真的，但情况 
会随矩阵程序不断改进而改变. ） 如果你从程序 
的特征向量构造 P ，注意检査 P 的条件数.这也许 
告诉你不可以真正求得3个线性无关的特征向量. 
A 的特征值是小实数，如果你的矩阵程序使用无 
穷精确的符号计算，你会发现 A 是不可对角化. 
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6.1 


3/35] 

-1/35 

-1/7 
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V 35 


|- 0 . 6 " 
^ 0.8 


15. 不正交 


2/ V 69 

4/ V 69 


13. 5 V 5 
17. 正交 

19. 写出答案之后参考“学习指导”. 

21.提 示：用 2.1 节的定理3和 2. . 

23.« v =0, ||« f =30, || vf =101, ||«+vf 

= (-5) 2 + (-9) 2 +5 2 =131 = 30 + 101. 

25. 所有的倍数的集合(当 v *0). 

27. 提示： 用正交性的定义. 

29. 提示： 考虑一个属于 W 的典型向量 》> = (& + 
... + c p v p 

31. 提示： 如果 x 属于那么 x 与 W 中任一向 
量正交. 

33. [ M ] 说明你的猜测且给出代数验证. 

6.2 

1. 不正交 3. 不正交 5. 正交 
7. 证明 u , . u 2 =0, 注意到定理4且观察到 R 2 中两 
个线性无关向量构成一个基，那么 得到： 

O 斑 HM3 
[1 13 .，=[:]+[:] 


9. 证明叫 w 2 =0,叫 w 3 =0且 w 2 .|< 3 =0 ， 注意到定 
理4且观察到 R 3 中线性无关向量构成一个基，那 
么得到 x=~Ui - ^ u 2 +~ u 3 =~Ui -~ u 2 +2 u 3 . 


27 18 5 

—1< 2 +— 


-厂 

0.61 s 


I ，」，^ 

[ l / V 3" 


-1/ V 2' 

1/ V 3 


0 

1/ V 3 


1 / V2 


19. 标准正交 
23.见“学习指导’ 


21. 标准正交 


25. 提示： || to || 2 =( to ) T ( to ), 同样，部分⑻和 ( c ) 
可从部 ( b ) 得到. 

27. 提示：你需要2个定理，其中一个仅应用于 
方阵. 

29. 提示： 如果你有一个候补逆，你可以检査这个 
候补是否可行. 

31. 假若 ji = U «, 对 c *0 Sc « 代替《 ; 那么 


(cw)-(cw) c 2 u. 

33. SL = Span{u }， 其中 k 非零，记 r(x) = proj t x ， 

根据定义， T(x) = Hw = (x. u)(w ■ u)' l u 

u，u 

对 nr 中的 X 和 :V ，任意数 C 和 d ， 内积的性 
质（定理 1 ) 说明 
T(cx-\-dy) = [(cc + 办 ) ■ u](u - u)~ ] u 

= [c(x w) + d(y - u)](u - u)~ l u 
=c(x -u)(u - u)~ l u +d(y - u)(u - u)~ l u 
= cT(x) + dT(y) 

因此 r 是线性的 . 

6.3 


： -|«i-|«2+|w3 + 2w 4 ； X = 


■ o ' 


'10' 

-2 

+ 

-6 

4 


-2 

-2 


2 


-7/3' 
7/3 
7/3 i 


9. y - 


' 3" 


-f 

-1 

13. 

-3 

1 


-2 



3_ 


U T U 


「1 ol 

= 01 


UU T = 


15. V 40 


8/9 -2/9 2/9" 
-2/9 5/9 4/9 

2/9 4/9 5/9 
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2" 


'2 

b- pT 0 j w y = 6u l +3u 2 = 

4 

, K(UU T )y = 

4 


5 


5 


19 - i 

' 0 " 

2/5 

的任何倍数，如 

[° 2 ] 

1 

1/5 - 


iij 


21. 在査阅“学习指导”之前，写出答案. 

23. 提示：用定理3和正交分解定理’对惟一性，假 
若却 =*和却 ,=*， p = p ,+( p - p ,) 
fO /> = /> + 0. 


6.4 



" 2 
3. —5 


3/2 

3/2 


2/V30" 

-5/ V 30 
1/ V 30 


2/ S ' 

\/S 

\/S 



15.(2 = 


'1/ V 5 1/2 

-1/ V 5 0 

-1/ V 5 1/2 

1/ V 5 -1/2 


1/2 

0 

1/2 

1/2 


1/ V 5 1/2 -1/2 


V5 -V5 4^5' 

，尺 = 0 6 —2 

0 0 4 


17 •见“学习指导’ 


19. 假若 x 满足 /Jr = 0， 那么2办 = G 0 = 0， 且 
At =0 ，由于 A 的列是线性无关， x 必须是零. 
这个事实，反过来，说明的列是线性无关，因 
为尺是方阵，由可逆矩阵定理可知它是可逆的. 
21. 记 G 的列为奶，…而，注意因为 A 是 
mxn 且有线性无关的列，利用事实， g 的列 


可以扩充为 IT 的一个标准正交基，如 
“学习指导”描述了一个方法)，取 
Go =[%+>〜如]那么 a=[G Go], 利用矩阵分 

解乘积 aJ^J=G 尺 = a . 

23. 提示： 将做为 2x2 分块矩阵. 

25. [M]i? 的对角元素是20, 6, 10.3923 和 7.0711, 
精确^0 4位小数. 


6.5 



办_如= 3 ,否，《不可能是 /b;=J 的一个 

-2 


15. 


最小二乘解.为什么？ 



17 •见“学习指导’ 


19. a. 如果 /Ut=0， 那么 A T Ac = A T 0 = 0 ，这说明 
NulA 包含在 Nul A T A 中. 
b. 如果 A T Ar = 0， 那么 x T A T /4x = x T 0 = 0， 所 
以， （如) T (/U) = 0( 这说明 |/4xf =0)，因此 
如=0 ,这说明 Nul A T A 包含在 Nul A 中. 
21. 提示： 对 (a)， 利用第2章的一个重要 定理. 
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23.由定理 14， b^Ax = A(A T Ay l A I b ,矩阵 
A(A T Ay'A T 在统计中经常出现，通常称为帽子 
矩阵. 

25. 标准方程是 g = 它的解 JiUy) 

的集合使得 Jt + ;y = 3 . 解对应位于直线 
x +y = 2和 ； c +y = 4中间的点集. 


6.6 


1. y = 0.9 + 0.4x 3. y = l.l + 1.3x 

5. 如果两个点集有不同的； c 坐标，那么设计矩阵 


X的两列不可能是相互是倍数，因而它们线性 
无关.由 6.5 节的定理14,标准方程有惟一解. 


y = xp+e. 


丫 8 _ 


— 1 1 ' 

2.7 


2 4 

3.4 

， x = 

3 9 

3.8 


4 16 

3.9 


5 25 




b. [M]y = 1.76x-0.20x 2 


9. y = Xp+e ，其中 > = 

"7.9" 

5.4 

， x = 

cosl sinf 

cos 2 sin 2 

i 

-0.9 

1 

cos 3 sin 3 



11. [M]# = 1.45 和 e = 0.811; 轨迹一个椭圆，方程 
r = p/(l-e cos j ?) ,当 j ? = 4.6 时， r = 1.33 . 


13. [M] a. y = -0.8558 + 4.7025 / + 5.5554f 2 - 0.0274f 3 
b. 速度函数是 


v(f) = 4.7025 +11.1108f - 0.0822f 2 
v(4.5) = 53.0 英尺 / 秒 

15. 提示： 写出在方程 (1) 中的 X 和; v ，且计算 
■和； 


17. a. 数据 x 的平均 jc = 5.5, 数据的平均偏差形 
式是(-3.5，1),(-0.5,2),(1.5,3)，(2.5,3). X 的 
列是正交的,因为第2列中元素之和为零. 



19. 提示： 方程有一个好的几何解释. 

6.7 

l.a.3, Vl05 , 225 b. 所有 的倍数 
3.28 5. 5V2 , 3^3 

9. a. 常数多项式， p{t) = 5 
b. f 2 -5 是正交于 p。 和 p, ，值： (4, -4, -4, 4)； 

答案： q(t) = -(t 2 -5) 

4 


13. 验证 4 个公理中的每一个，例如 
1. («,v) = (A«)-(Av) 定义 

= (Av) (Au) 点积的性质 
= <v,«> 定义 

15. («,cv) = <cv,«> 公理 1 
= c(v,u) 公理3 
= c(u,v) 公理 1 

17. 提示： 计算4乘右手边. 

19. {u,v) = sfa-Jb+^Jb4a=24ab , 

||«f = (Mf + (W) 2 = a + ， 因为 非负，所以 
||«|| = V^， 类似， ||v|| = V^, 由柯西-施瓦茨 
不等式， 2-Jab ^ ■Ja + b'Jb + a =a + b ，因而 

4 ab ^^. 

21.0 23. 2/V5 25. 1, t , 3f 2 -l 

27. [ M ] 新的正交多项式是 - I7f + 5z 3 和 
72-155f 2 +35f 4 的倍数，重新度量这些多项式 
使得它们在-2, -1，0，1和2的值是小整数. 
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6.8 

1. 厂 2 + | f 

3. p ( t ) = 4p 0 ~ OAp l -0.5/ j 2 +0.2/ j 3 

= 4-0.1 f -0.5(/ 2 -2) + 0.2(暑， 3 -到 

( 这个多项式精确地拟合了数据 .） 

5. 利用等式 

sin sin nr =— [ cos ( m / - nt ) - cos(mr + nl )] 

I . 利用等式 C 0 s 2 fo = 1 + C f 2fo . 

9. Jt + 2 sin / + sin 2/ + | sin 3 f (提 示： 利用例 4 的结 
果可节约时间）. 

II. 去-去 cos 2 / (为什么？） 

13. 提示： 选取 C [0,2 ji ] 中的函数/ 

一个整数 m >0 .写出 / + g 的包含 cos mf 的傅 
里叶系数且写出包含 sin mf 的傅里叶系数 
(m > 0). 

15. [ M ] 立方曲线是下列函数的图像 


的第 j 列，由于= ( Uej )- { Ue i ) = e J - e l =1, U 
的列是单位向量，由于对, 
{ Ue ) )-{ Ue k ) = e j - e l = 0 ,列是两两正交. 

7. 提示： 计算 (2 T G ，利用事实 («« T ) T = u Tr u T = uu T . 

9. 设灰=5?311{|<，》>}.给定1{”中的 2 ，设 hprc^z, 
那么£属于 Col A , 此处 A = [« v ], 例如，对 R 2 
中的一些: e ，有 z '= 处，所以: e 是 /4 x = z 的一 
个最小二乘解，标准方程可以解出 i ，那么£可 
通过计算处得到. 


X 


a 


r 

y 

, b = 

b 

» v= i 

-2 

_z_ 


■ c 」 

1 

5 



V" 


"1 -2 5' 

A = 

v T 

= 

1-2 5 

且固定 i 

， T 」 


1 -2 5_ 


给定的方程组是 


Ax=b ,且所有最小二乘解的集合与 
A T /Ut = 的解集相一致 （6.5 节定理 13), 

这可利用事实 （ vv T )x = v ( x T x ) = ( v T x)v ,其中 
V T X 是数. 


g ( f ) =-0.2685 + 3.6095 f + 5.8576 Z 2 - 0.0477/ 3 . 在 
/ = 4.5 秒速度是 g '(4.5) = 53.4 英尺/秒.这比 6.6 
节习题13中估计得到的结果快0.7%. 

第6章补充习题 

l.a. F b. T c. T d. F e. F 

f . T g.T h.T i.F j.T 

k. T 1. F m. T n. F o. F 
P- T q. T r. F s. F 

3. 给定 x 和] r 中一个标准正交基 { V ,,..., Vp )， 设 
■ e 是 x 在由 v ,，...， v p 生成的子空间上的正交投影， 
由 6.3 节的定理 10 ，： e = ( x . v 1 ) v 1 + … + ( x . v p )»v 
由习题2，絆| 2 =卜，| 2 +… + | x . v p | 2 . 贝塞尔不 
等式可从 ||if <|| xf 得到，该不等式在 6.7 节柯 
西-施瓦茨不等式的证明前面给出. 

5. 假若对任意 o 属于] T 有叫 ).( 吵） = ，且 
设…，是 IT 的标准基，对 j = 1，…， n ， Uej 是 t / 


13. a . A « 的行 一列计 算表明 A 的每一行是与 
Nul A 中的每一个《正交的.所以 A 的每一 
行是属于 （Nul A )' 由于 （Nul 是一个 
子空间，它必须包含 A 的行的所有线性组 
合； 因此 (Nul Ap 包含 Row A . 

b . 如果 rank A = r , 那么由秩定理 
dim Nul A = n-r, 由 6.3 节的习题 24( c ), 有 
dim Nul A + dim(Nul A ) 1 = n 

所以 dim(Nul A ) 1 一定是 r , 但由秩定理和 
⑻可知 Row A 是一个 （Nul A )* 1 的 r -维子 
空间，所以 Row A 必须和 （Nul A ， 一致. 

c . 在 ( b ) 中用 A t 代替 A 且可得 Row A T 和 
(Nul A 7 )*" —致，又由于 Row A T =Col A, 
这就证明了 ( c ). 

15. 如果4 是正交的，那么 A 与尺相 

似(因为 t / 是可逆的且 t /' tr 1 ), 且 A 与尺具 
有相同特征值 (5.2 节定理 4); 就是„个在对 
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角线上的实数 
17. [M 




0.4618, cond ( A ) xJ !^ = 3363 x (1.548 


xl0^) = 0.5206. 

注意 |At||/||jc|| 约等于 cond(A) 乘 ||M||/||^||. 

19. [M] ^ = 7.178X 10- 8 M = 2.832X 10^ , 注意 

x 的相对改变比 6 的相对改变小很多，事实 
上，由于 


cond(A)x 


臂 = 


23683 x (2.832 x HT 4 ) = 6.707 


x 相对改变的理论上界是 6.707( 到4位有效数 
字).这个习题表明，既使一个条件数很大 ，一 
个解的相对误差并不像你想象的那么大. 


第 7 章 


对称 3. 不对称 

「0.6 0.8] 

[0.8 ~0.6」 

2/3 0 5/ V 45 

2/3 1/ V 5 -4/ V 45 

1/3 -2/ V 5 -2/ V 45 
[l/V2 -1/ V 21 _「 4 0] 

I ! 芯 i/^r D= L o 2 J 


正交. 


ii . 正交， 


5. 不对称 
9. 不正交 


1 < p — 

卜 叫， d = 

[17 ( 

>1 


1_ 1 / V17 4 / V17J ' 

[0 ( 

)J 


[ l / V 3 1/76 - I / V2 " 


■5 0 O' 

17. P = 

1/ V 3 -2/S 0 

， D = 

0 2 0 


1 / V3 1 / V6 1 / V2 


0 0-2 


-1/V5 4 / V45 -2/3 


"7 0 O' 

19. P = 

2/ V 5 2/ V 45 -1/3 

, D = 

0 7 0 


0 5/ V 45 2/3 


0 0-2 


「 0.5 -0.5 -1/V2 

[) _ 




0.5 

0.5 

0 -1/V2 




0.5 -0.5 l/>/2 

[) 




0.5 

0.5 

0 1/V2 




■9 0 

0 0 






0 5 

0 0 






0 0 

1 0 






0 0 

0 1 






vS 

-1/V2 -\ i 4 e 


■5 

0 

o' 

mS 

l/>/2 

-1/V6 

， D 

- 

0 

2 

0 

1/V3 

0 

2/S 


0 

0 

2 


25.见“学习指导”. 

27. (B t AB) t = B t A t B tt 转置乘积的顺序是原乘 
积的相反顺序 
= B t AB 由于 A 对称 


当 A = /时关于 fiTfi 的结果是一个特殊情况， 
{BB 1 ) 1 =B Tl B 1 ^BB 1 , 所以 是对称的. 
29. 提示： 用 A 的一个正交对角化，或用定理 2. 
31. 5.3 节的对角化定理说明 P 的列是(线性无关 
的） D 中对角形列出的 A 的特征值对应的特征 
向量，所以 P 正好有 t 列特征向量对应; I ，这 
* 列形成特征空间的一个基. 

33. A = 811,11, T + 6 u 2 uJ +3 u 3 u 3 t 
「1/2 - 1/2 0 "] 

= 8 - 1/2 1/2 0 


0 0 0」 



1/6 1/6 -2/6" 

1 

'1/3 1/3 1/3* 

+ 6 

1/6 1/6 -2/6 

+ 3 

1/3 1/3 1/3 


-2/6 -2/6 4/6 

1 

1/3 1/3 1/3 


35. 提示： （ iiii T )jc = ii ( ii T jc ) = ( ii T jc ) ii ，由于 u t jc 是 
一个数. 


7.2 


l.a. 5 x ^ +^ x , x 2 + X2 b . 185 c. 16 

3 .a.M b 仏 I 
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■8-3 2 


0 

2 3" 

5. a. 

-3 7-1 

b . 

2 

0 -A 


2-1-3 


3 

-4 0 


7. x = Py , 此处/> =太 [: |J , y T Dy =6 yf -4 yl 
在习题9~14中，其他答案（坐标变换和新的 


二次型）也有可能. 

9. 正定，特征值是7和2 

坐标 改变 ： x = Py ,其中 P = 


丄 I"] 2 ] 

况2 1 


新的二 次型： 7^ + 2^ 
11. 不定，特征值是7和 -3 


坐标变换 ： x = Py 


其中尸 



新的二 次型： lyl-'iyl 
13. 半正定，特征值是 10 和 0 

坐标变换 ： x = Py , 其中/ > = ^| ;; 


新的二 次型： 10 y, 2 

15. [ M ] 半 负定： 特征值是： 0, -6, -8, -12, 坐 
标变换 ： x = Py 

'3/VI2 0 -1/2 0 

1/Vl2 -2/V6 1/2 0 

P = 

1/Vl2 1/V6 1/2 -1/V2 

1/Vl2 1/V6 1/2 1/V2 


新的二 次型： -6 y 2 2 - Sy 2 ,- l 2 y 2 4 
17. [ M ] 不定，特征值是 8.5, -6.5 
坐标变换* =作； 


泰 4 

0 


^3 4 " 

0-5 0 

3 4-3 

5 0 5 


新的二 次型： 8.5y, 2 +8.5y 2 2 -6.5 yl -6.5 yl 


— A 2 —(a + d)X + ad—b 2 

( A —又 1 ) (又一又 2 )= 又 2 — (又 l + 又2)又 + 又1又2系数相 
^m^+X 1 =a + dm^X 1 =ad-b 2 =detA. 
25. 7.1 节的习题27表明是对称的，并且， 
x t B t Bx = ( Bx ) j Bx = \\ Bx \\ 2 ^0 , 所以二次型是 
半正定，并且我们说矩阵是半正定， 提示： 
为证明当 S 是方阵且可逆时是正定，假若 
jc t S t 彻= 0然后推出 jc = 0. 

27. 提示： 证明 A + S 是对称的且二次型 
jc T (A + fi ) Jt 是正定的. 






1/3 

2/3 

-2/3' 

1. JC 

=Py 

, 此处 p = 

2/3 

1/3 

2/3 





-2/3 

2/3 

1/3 




1/3 




3. a. 


b -± 

2/3 


c.6 





-2/3 




5. a. 

7 

b ■士 

-1/V2" 

1/V2 

c.3 



1/3' 






7 .土 

2/3 


9. 5 + V5 


11.3 


2/3 







13. 提示 ：如果 m = M ，对 jc 取公式中的 a = 0, 
也就是说，取 Jt = «„ 且验证 x T M = m . 如果 


m < M 且如果 f 是介于 m 和 M 中间的数，那 
么0彡且0彡 （ f - m)!(M 一 m ) 彡 1 ， 
所以，设 a = ( f - m )/( M - m ) ，解这个 a 的表 
达式得到 f = ( l - oOm+aM ，当 a 变化从0到 


1 ， f 从 m 变化到 M ，像习题中所陈述的那样 


构造 JC 且验证它的性质. 


0.5' 

15. [ M ] a.7.5 b . 0,5 
0.5 


c. -0.5 


19. 8 


21 .见“学习指导”. 

23. 用两种方式写出特征多项式 


det(A-A/) = det 


a-X 

b 



17. [ M ] a . -4 


b . 


_0.5 」 

-3/Vl2 

1/Vl2 

1/Vl2 

1/Vl2 


c. -10 
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1 3.3, 2 

习题 5~13 中的答案不是惟一的. 


5. 

-3 0 

J- 1 °1 

p °1 

p 0 


0 0 

!_ o ij 

[0 oj 

Lo 1 

7. 

： i/Vs" 

-2/V5] [1 

01 「 

2/V5 


2/^5 

1/^J Lo 2j [ 

-1/V5 


r i/V2 

-1/V2 0 

"3V10 

0 

9. 

0 

0 1 

0 

V10 


1/V2 

1/V2 0 

0 

0 


1/ V 5' 

2/V5 


2/V5 
-1/V5 

-1/3 2/3 2/3] r3VlO o' 

2/3 -1/3 2/3 0 0 

2/3 2/3 -l/3j 0 0 

x r3/Vio -1/V10" 

Ll/VlO 3 _」 
p 2 2l = |l/V2 -1/V2 

1_2- 3 — 2 」 11/V2 1/V2 

' 1/V2 1/V2 0 

-1/Vl8 1/Vl8 -4/Vl8 

-2/3 2/3 1/3 

15. a . rank A = 2 


'5 0 0" 
0 3 0 



" 0.40' 

I 

"-0.78' 

b.Col A 的基： 

0.37 

M 

-0.33 

1 

-0.84 J 


-0.52 


Nul A 的基: 


-0.58 

0.58 


( 记住 V T 出现在 SVD 中 


17. 由于 A 是方阵且可逆 
rank A = n , 且 Z 中所有对角元素必须非零， 
所以 A -1 = ( t / z V 1 )' 1 = ve -' i /-' = Vlr ' U 1 . 

19. 提示： 由于 t / 和 V 是正交的， 

4 T A = ( ULV T ) T UI . V T = VL t U t UI . V t 
= V(Z T Z)V' 

这样 V 将 A T A 对角化，这里 V 告诉你些什< 


21- SA = t / ZV T ， 矩阵尸 [/是正交的，由 于尸和[/ 
都正交（见 6.2 节习题29)，所以方程 


PA = ( PU ) LV t 有奇异分解值需要的形式.由习 
题19， Z 中的对角元素是 PA 的奇异值. 

23. 提示： 利用 ( t / Z ) V T 的列行展开. 

25. 提示： 考虑 r 的 SVD 的标准矩阵，如 

A = ULV T = ULV-\m = lv u -,v n mC = l Ul ,-, 

〜} 分别是 V 和 t / 的列构成的基.像 5.4 节计 
算 r 相对于 S 和 C 的矩阵，为进行这些，你必 
须证明的第^ /列. 

"-0.57 -0.65 -0.42 0.27' 

27 [ M ] 063 ~°. 24 -°- 68 -0-29 

0.07 -0.63 0.53 -0.56 

.-0.51 -0.34 -0.29 -0.73 
16.46 0 0 0 0 

x 0 12.16 0 0 0 

0 0 4.87 0 0 

.0 0 0 4.31 0 

-0.10 0.61 -0.21 -0.52 0.55' 

-0.39 0.29 0.84 -0.14 -0.19 

x -0.74 -0.27 -0.07 0.38 0.49 

0.41 -0.50 0.45 -0.23 0.58 

.-0.36 -0.48 -0.19 -0.72 -0.29 

29. [ M ]25.934 3, 16.755 4, 11.291 7, 1.078 5, 0.003 779 3； 

( T , /( T 5 = 68 622 . 





3 - U?l 雌 A= 95 . 2 ， f=] 对应 a=6 . 8 


5. [ M ](0.130, 0.874, 0.468), 方差的 75.9%. 

7_ yi =0.95^, -0.32x 2 ; y , 解释方差的 93.3%. 

9 - c ， =1/3 ,0=2/3, c 3 =2/3, y 的方差是 9. 

11. a . 如果中的向量，其中每个位置都是 
1，因为 A 是平均偏差形式，那么 
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[AT, ••- X N ] H> = Ar,+ … + AT« =0 

于是 [y, … y«]H>=o T A ■，… p t x n ]w 根据 
定义= 〆[；!：, ... A： Jh > = P t 0 = 0 也就是说， 
y |+ — + y„= 0 , 所以 y t 是平均偏差形式. 
b. 提示： 由于 AT; 是平均偏差形式，尤;的协 
方差矩阵是 1/(W - i)[n«] [n«] T 利 
用 (a ), 计算 y; 的协方差矩阵. 

13. 如果 fi = d.U ，那么 

'xf 


且利用它产生 A 的一个乔累斯基分解 • 

9. 如果4是一个 mxn 且 x 属于 K " ，那么 
x t A t Ax = (Ax) t (Ax) = ||A*|| 2 > 0，那么 A t A 是半 
正定，由 6.5 节习题22, rank A T A = rank A. 

11. 提示： 将 A 的一个 SVD 写成形式 
A = ULV t =PQ, 其中尸 = t/zt/ T WG = f/v T 
证明 P 是对称且有与 Z 同样的特征值，解释为 
什么 G 是正交矩阵. 

13. a. 如果办=办，那么 JC + =Al = AVb:， 由习题 
12(a), jc + 是 * 在 Row A 上的正交投影. 
b. 从 （a ) 和习题 12( c ) , Ax*=A(A*Ax) 


= X 戈丄 T = ( n )(Ar * _Af) T 


= (AA + A)x = Ax = b. 

c . 由于 JC + 是 JC 在 Row A 上的正交投影，由勾 


第 7 章补充习题 


1. a.T b. F 

c. T 

d.F 

e. F 

f. F g . F 

h.T 

i. F 

j-F 

k. F 1. F 

m. T 

n. F 

o. T 

P-T q.F 

3 .如果 rank A = r 

，那么由秩定理 dim Nul A 


= n-r, 所以，0是重数为 n-/ •的特征值，因 
此， A 的谱分解中的 n 项，正好有 （n-r) 个为 
零，其余的 r 项，（对应非零特征值)都是秩为1 
的矩阵，像谱分解中讨论的一样. 

5.如果对一些非零； I 有 Av = ；lv ,那么 
v = A-'Av = 4( A - V ) ,它证明 v 是 A 的列的一个 
线性组合. 

7. 提示： 如果 A = /? T /?， 其中/?是可逆的，由 7.2 
节的习题25,那么 A 是正定的.相反地，假若 A 


股定理 

HHMf+lhl 2 


( C ) 立即得证. 



-2 

-14 

13 

131 


' 0.7" 


一 2 

-14 

13 

13 


0.7 

15 .關，=忐 

-2 

6 

-7 

-7 

,x = 

-0.8 

2 

-6 

7 

7 


0.8 


4 

-12 

-6 

-6 • 


0.6 


的简化阶梯形除零以外的其他行外，与 A 

的简化阶梯形一致，所以，将4中行乘上一个数 
量加到: c T 可产生零向量，这说明 * T 属于 


Row A . 

'-ll fo" 
1 0 

Nul A 的基： o ， 1 
0 1 


是正定，那么 7.2 节的习题26,对一些正定矩 
阵 S 有 A = .解释为什么 S 有一个 QR 分解， 




